Commit 3ac1694f authored by zhougaofeng's avatar zhougaofeng
Browse files

Update README.md

parent 6a26a510
...@@ -5,6 +5,12 @@ ...@@ -5,6 +5,12 @@
`MetaMath: Bootstrap Your Own Mathematical Questions for Large Language Models` `MetaMath: Bootstrap Your Own Mathematical Questions for Large Language Models`
- [https://arxiv.org/abs/2309.12284] - [https://arxiv.org/abs/2309.12284]
## 模型架构
MetaMath在MetaMathQA数据集上对LLama-2模型进行微调,LLama-2基于Transformer架构,具有自注意力机制、位置编码、多头注意力、前馈神经网络、残差连接和层归一化等特点。它通过预训练和微调在大规模语料库上学习语言模式和知识,并在特定任务上表现出色。
## 算法原理 ## 算法原理
MetaMath是专门针对数学推理进行微调的语言模型。具体来说,从多个角度重写数学问题来引导启动数学问题,形成了一个名为MetaMathQA的新数据集。然后在MetaMathQA上对LLaMA-2模型进行微调。在两个流行的数学推理基准测试(即GSM8K和MATH)上的实验结果表明,MetaMath在一系列开源LLMs中取得了显著的性能优势。 MetaMath是专门针对数学推理进行微调的语言模型。具体来说,从多个角度重写数学问题来引导启动数学问题,形成了一个名为MetaMathQA的新数据集。然后在MetaMathQA上对LLaMA-2模型进行微调。在两个流行的数学推理基准测试(即GSM8K和MATH)上的实验结果表明,MetaMath在一系列开源LLMs中取得了显著的性能优势。
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment