Commit 11e5eb08 authored by chenych's avatar chenych
Browse files

Update README.md

parent c345225e
...@@ -3,7 +3,6 @@ ...@@ -3,7 +3,6 @@
[Qwen3.6](https://qwen.ai/blog?id=qwen3.6) [Qwen3.6](https://qwen.ai/blog?id=qwen3.6)
## 模型简介 ## 模型简介
Qwen3.6是一款采用混合专家 (MoE) 架构并包含视觉编码器的多模态因果语言模型。此版本重点优化了智能体编程 (Agentic Coding) 的准确率,并引入了思维保留 (Thinking Preservation) 机制,特别适合长上下文和复杂的代码仓库开发任务。 Qwen3.6是一款采用混合专家 (MoE) 架构并包含视觉编码器的多模态因果语言模型。此版本重点优化了智能体编程 (Agentic Coding) 的准确率,并引入了思维保留 (Thinking Preservation) 机制,特别适合长上下文和复杂的代码仓库开发任务。
<div align=center> <div align=center>
...@@ -43,11 +42,13 @@ docker run -it \ ...@@ -43,11 +42,13 @@ docker run -it \
更多镜像可前往[光源](https://sourcefind.cn/#/service-list)下载使用。 更多镜像可前往[光源](https://sourcefind.cn/#/service-list)下载使用。
关于本项目DCU显卡所需的特殊深度学习库可从[光合](https://developer.sourcefind.cn/tool/)开发者社区下载安装。 关于本项目DCU显卡所需的特殊深度学习库可从[光合](https://developer.sourcefind.cn/tool/)开发者社区下载安装。
## 预训练权重 ## 预训练权重
| 模型名称 | 权重大小 | 数据类型 |支持的DCU型号 | 最低卡数需求 | 下载地址 | | 模型名称 | 权重大小 | 数据类型 |支持的DCU型号 | 最低卡数需求 | 下载地址 |
|:------:|:----:|:----:|:----------:|:------:|:---------------------:| |:------:|:----:|:----:|:----------:|:------:|:---------------------:|
| Qwen3.6-35B-A3B | 35B | BF16 |BW1000 | 2 | [Hugging Face](https://huggingface.co/Qwen/Qwen3.6-35B-A3B) | | Qwen3.6-35B-A3B | 35B | BF16 | BW1000 | 2 | [Hugging Face](https://huggingface.co/Qwen/Qwen3.6-35B-A3B) |
| Qwen3.6-27B | 27B | BF16 |BW1000 | 2 | [Hugging Face](https://huggingface.co/Qwen/Qwen3.6-27B) | | Qwen3.6-27B | 27B | BF16 | BW1000 | 2 | [Hugging Face](https://huggingface.co/Qwen/Qwen3.6-27B) |
## 数据集 ## 数据集
暂无 暂无
...@@ -55,9 +56,7 @@ docker run -it \ ...@@ -55,9 +56,7 @@ docker run -it \
暂无 暂无
## 推理 ## 推理
### vllm ### vllm
#### 单机推理 #### 单机推理
```bash ```bash
## serve启动 ## serve启动
...@@ -104,16 +103,15 @@ curl http://localhost:8001/v1/chat/completions \ ...@@ -104,16 +103,15 @@ curl http://localhost:8001/v1/chat/completions \
</div> </div>
### 精度 ### 精度
测试数据:humaneval、gsm8k,使用的加速卡:bw1000。 - 推理框架:vllm
- 测试数据:humaneval、gsm8k
- 使用的加速卡:bw1000
| model name| humaneval | gsm8k | | model name| humaneval | gsm8k |
| :------: | :------: | :------: | | :------: | :------: | :------: |
| Qwen3.6-27B | 0.8293 | 0.98 | | Qwen3.6-27B | 0.8293 | 0.98 |
| Qwen3.6-35B-A3B | 0.878 | 0.976 | | Qwen3.6-35B-A3B | 0.878 | 0.976 |
推理框架:vllm。
## 源码仓库及问题反馈 ## 源码仓库及问题反馈
- https://developer.sourcefind.cn/codes/modelzoo/qwen3.6 - https://developer.sourcefind.cn/codes/modelzoo/qwen3.6
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment