Update README.md

ee04b641 · dengjb · 6bb9de77 · ee04b641
Commit ee04b641 authored Aug 13, 2024 by dengjb
Show whitespace changes
Inline Side-by-side

Showing with 3 additions and 7 deletions

README.md README.md +3 -7

No files found.
--- a/README.md
+++ b/README.md
@@ -5,14 +5,10 @@ Codestral模型支持80+的编程语言
 ## 模型结构
 Transformer 架构是一种在自然语言处理（NLP）中广泛应用的深度学习架构。
 它的核心特点包括：
+- 多头注意力机制（Multi-head Attention）：这使得模型能够同时关注输入序列的不同位置，并学习到不同的表示。例如，在翻译任务中，能够同时关注源语言句子中的不同词汇与目标语言词汇的关系。
-多头注意力机制（Multi-head Attention）：这使得模型能够同时关注输入序列的不同位置，并学习到不同的表示。例如，在翻译任务中，能够同时关注源语言句子中的不同词汇与目标语言词汇的关系。
+- 前馈神经网络（Feed Forward Network）：用于对注意力机制的输出进行进一步的特征提取和转换。
+- 位置编码（Positional Encoding）：由于 Transformer 本身不具有捕捉序列顺序的天然能力，位置编码为输入序列中的每个位置添加了位置信息，以便模型理解词语的顺序。
-前馈神经网络（Feed Forward Network）：用于对注意力机制的输出进行进一步的特征提取和转换。
-位置编码（Positional Encoding）：由于 Transformer 本身不具有捕捉序列顺序的天然能力，位置编码为输入序列中的每个位置添加了位置信息，以便模型理解词语的顺序。
 <div align=center>
    <img src="./assets/model_framework.png"/>