Skip to content
GitLab
Menu
Projects
Groups
Snippets
Loading...
Help
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in / Register
Toggle navigation
Menu
Open sidebar
ModelZoo
MetaMath_7B_pytorch
Commits
3ac1694f
Commit
3ac1694f
authored
Nov 26, 2024
by
zhougaofeng
Browse files
Update README.md
parent
6a26a510
Changes
1
Hide whitespace changes
Inline
Side-by-side
Showing
1 changed file
with
6 additions
and
0 deletions
+6
-0
README.md
README.md
+6
-0
No files found.
README.md
View file @
3ac1694f
...
@@ -5,6 +5,12 @@
...
@@ -5,6 +5,12 @@
`MetaMath: Bootstrap Your Own Mathematical Questions for Large Language Models`
`MetaMath: Bootstrap Your Own Mathematical Questions for Large Language Models`
-
[https://arxiv.org/abs/2309.12284]
-
[https://arxiv.org/abs/2309.12284]
## 模型架构
MetaMath在MetaMathQA数据集上对LLama-2模型进行微调,LLama-2基于Transformer架构,具有自注意力机制、位置编码、多头注意力、前馈神经网络、残差连接和层归一化等特点。它通过预训练和微调在大规模语料库上学习语言模式和知识,并在特定任务上表现出色。
## 算法原理
## 算法原理
MetaMath是专门针对数学推理进行微调的语言模型。具体来说,从多个角度重写数学问题来引导启动数学问题,形成了一个名为MetaMathQA的新数据集。然后在MetaMathQA上对LLaMA-2模型进行微调。在两个流行的数学推理基准测试(即GSM8K和MATH)上的实验结果表明,MetaMath在一系列开源LLMs中取得了显著的性能优势。
MetaMath是专门针对数学推理进行微调的语言模型。具体来说,从多个角度重写数学问题来引导启动数学问题,形成了一个名为MetaMathQA的新数据集。然后在MetaMathQA上对LLaMA-2模型进行微调。在两个流行的数学推理基准测试(即GSM8K和MATH)上的实验结果表明,MetaMath在一系列开源LLMs中取得了显著的性能优势。
...
...
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
.
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment