Commit e8663961 authored by laibao's avatar laibao
Browse files

Update README.md

parent 3c631e30
Pipeline #1771 failed with stages
in 0 seconds
...@@ -16,7 +16,7 @@ ...@@ -16,7 +16,7 @@
Qwen2.5是阿里云开源的最新一代大型语言模型,标志着Qwen系列在性能和功能上的又一次飞跃。本次更新着重提升了模型的多语言处理能力,支持超过29种语言,包括中文、英文、法文、西班牙文、葡萄牙文、德文等。所有规模的模型现在都能支持高达128K tokens的上下文长度,并能生成最长8K tokens的内容。预训练数据集也从7T tokens扩展到了18T tokens,显著提升了模型的知识储备。此外,Qwen2.5还增强了对系统提示的适应性,提升了角色扮演和聊天机器人的背景设置能力。模型系列包括从0.5B到72B不同参数规模的版本,以满足不同应用场景的需求 。 Qwen2.5是阿里云开源的最新一代大型语言模型,标志着Qwen系列在性能和功能上的又一次飞跃。本次更新着重提升了模型的多语言处理能力,支持超过29种语言,包括中文、英文、法文、西班牙文、葡萄牙文、德文等。所有规模的模型现在都能支持高达128K tokens的上下文长度,并能生成最长8K tokens的内容。预训练数据集也从7T tokens扩展到了18T tokens,显著提升了模型的知识储备。此外,Qwen2.5还增强了对系统提示的适应性,提升了角色扮演和聊天机器人的背景设置能力。模型系列包括从0.5B到72B不同参数规模的版本,以满足不同应用场景的需求 。
<div align=center> <div align=center>
<img src="./doc/qwen1.5.jpg"/> <img src="./doc/qwen2.5.jpg"/>
</div> </div>
## 算法原理 ## 算法原理
...@@ -24,7 +24,7 @@ Qwen2.5是阿里云开源的最新一代大型语言模型,标志着Qwen系列 ...@@ -24,7 +24,7 @@ Qwen2.5是阿里云开源的最新一代大型语言模型,标志着Qwen系列
和Qwen一样,Qwen2.5仍然是一个decoder-only的transformer模型,使用SwiGLU激活函数、RoPE、多头注意力机制等。 和Qwen一样,Qwen2.5仍然是一个decoder-only的transformer模型,使用SwiGLU激活函数、RoPE、多头注意力机制等。
<div align=center> <div align=center>
<img src="./doc/qwen1.5.png"/> <img src="./doc/qwen2.5.png"/>
</div> </div>
## 环境配置 ## 环境配置
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment