Update README.md

3ac1694f · zhougaofeng · 6a26a510 · 3ac1694f
Commit 3ac1694f authored Nov 26, 2024 by zhougaofeng
Hide whitespace changes
Inline Side-by-side

Showing with 6 additions and 0 deletions

README.md README.md +6 -0

No files found.
--- a/README.md
+++ b/README.md
@@ -5,6 +5,12 @@
 `MetaMath: Bootstrap Your Own Mathematical Questions for Large Language Models`
 - [https://arxiv.org/abs/2309.12284]
+## 模型架构
+MetaMath在MetaMathQA数据集上对LLama-2模型进行微调，LLama-2基于Transformer架构，具有自注意力机制、位置编码、多头注意力、前馈神经网络、残差连接和层归一化等特点。它通过预训练和微调在大规模语料库上学习语言模式和知识，并在特定任务上表现出色。
 ## 算法原理
 MetaMath是专门针对数学推理进行微调的语言模型。具体来说，从多个角度重写数学问题来引导启动数学问题，形成了一个名为MetaMathQA的新数据集。然后在MetaMathQA上对LLaMA-2模型进行微调。在两个流行的数学推理基准测试（即GSM8K和MATH）上的实验结果表明，MetaMath在一系列开源LLMs中取得了显著的性能优势。