Update README.md

6bb9de77 · dengjb · 88764f71 · 6bb9de77
Commit 6bb9de77 authored Aug 13, 2024 by dengjb
Hide whitespace changes
Inline Side-by-side

Showing with 13 additions and 2 deletions

README.md README.md +13 -2

No files found.
--- a/README.md
+++ b/README.md
@@ -4,13 +4,24 @@ Codestral模型支持80+的编程语言
 暂无

 ## 模型结构
-基于Transformer架构。
+Transformer 架构是一种在自然语言处理（NLP）中广泛应用的深度学习架构。
+
+它的核心特点包括：
+
+多头注意力机制（Multi-head Attention）：这使得模型能够同时关注输入序列的不同位置，并学习到不同的表示。例如，在翻译任务中，能够同时关注源语言句子中的不同词汇与目标语言词汇的关系。
+
+前馈神经网络（Feed Forward Network）：用于对注意力机制的输出进行进一步的特征提取和转换。
+
+位置编码（Positional Encoding）：由于 Transformer 本身不具有捕捉序列顺序的天然能力，位置编码为输入序列中的每个位置添加了位置信息，以便模型理解词语的顺序。
+
 <div align=center>
    <img src="./assets/model_framework.png"/>
 </div>

 ## 算法原理
-Codestral使用了80+的编程语言的多样化数据集进行训练，并且可以完成编码功能、编写测试等有助于提高开发人员的编码水平并降低出现错误的风险。
+Codestral经过了80多种编程语言的多样化数据集训练，包括最流行的语言，例如 Python、Java、C、C++、JavaScript和Bash。它在Swift和Fortran等更具体的语言上也表现良好。这种广泛的语言基础确保Codestral能够在各种编码环境和项目中为开发人员提供帮助。
+
+Codestral为开发人员节省了时间和精力：它可以完成编码功能、编写测试并使用中间填充机制完成任何部分代码。与Codestral交互将有助于提高开发人员的编码水平并降低出现错误和错误的风险。


 ## 环境配置