Commit cda15681 authored by laibao's avatar laibao
Browse files

Update README.md

parent eb172eab
Pipeline #1747 canceled with stages
...@@ -4,13 +4,13 @@ ...@@ -4,13 +4,13 @@
* @Date: 2024-05-24 14:15:07 * @Date: 2024-05-24 14:15:07
* @LastEditTime: 2024-09-30 08:30:01 * @LastEditTime: 2024-09-30 08:30:01
--> -->
# Qwen1.5 # Qwen2.5
## 论文 ## 论文
## 模型结构 ## 模型结构
Qwen1.5是阿里云开源大型语言模型系列,是Qwen2.0的beta版本。相较于以往版本,本次更新着重提升了Chat模型与人类偏好的对齐程度,并且显著增强了模型的多语言处理能力。在序列长度方面,所有规模模型均已实现 32768 个tokens的上下文长度范围支持。同时,预训练 Base 模型的质量也有关键优化,有望在微调过程中带来更佳体验 Qwen2.5是阿里云开源的最新一代大型语言模型,标志着Qwen系列在性能和功能上的又一次飞跃。本次更新着重提升了模型的多语言处理能力,支持超过29种语言,包括中文、英文、法文、西班牙文、葡萄牙文、德文等。所有规模模型现在都能支持高达128K tokens的上下文长度,并能生成最长8K tokens的内容。预训练数据集也从7T tokens扩展到了18T tokens,显著提升了模型的知识储备。此外,Qwen2.5还增强了对系统提示的适应性,提升了角色扮演和聊天机器人的背景设置能力。模型系列包括从0.5B到72B不同参数规模的版本,以满足不同应用场景的需求
<div align=center> <div align=center>
<img src="./doc/qwen1.5.jpg"/> <img src="./doc/qwen1.5.jpg"/>
</div> </div>
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment