Commit 11e5eb08 authored by chenych's avatar chenych
Browse files

Update README.md

parent c345225e
......@@ -3,7 +3,6 @@
[Qwen3.6](https://qwen.ai/blog?id=qwen3.6)
## 模型简介
Qwen3.6是一款采用混合专家 (MoE) 架构并包含视觉编码器的多模态因果语言模型。此版本重点优化了智能体编程 (Agentic Coding) 的准确率,并引入了思维保留 (Thinking Preservation) 机制,特别适合长上下文和复杂的代码仓库开发任务。
<div align=center>
......@@ -43,11 +42,13 @@ docker run -it \
更多镜像可前往[光源](https://sourcefind.cn/#/service-list)下载使用。
关于本项目DCU显卡所需的特殊深度学习库可从[光合](https://developer.sourcefind.cn/tool/)开发者社区下载安装。
## 预训练权重
| 模型名称 | 权重大小 | 数据类型 |支持的DCU型号 | 最低卡数需求 | 下载地址 |
|:------:|:----:|:----:|:----------:|:------:|:---------------------:|
| Qwen3.6-35B-A3B | 35B | BF16 |BW1000 | 2 | [Hugging Face](https://huggingface.co/Qwen/Qwen3.6-35B-A3B) |
| Qwen3.6-27B | 27B | BF16 |BW1000 | 2 | [Hugging Face](https://huggingface.co/Qwen/Qwen3.6-27B) |
| Qwen3.6-35B-A3B | 35B | BF16 | BW1000 | 2 | [Hugging Face](https://huggingface.co/Qwen/Qwen3.6-35B-A3B) |
| Qwen3.6-27B | 27B | BF16 | BW1000 | 2 | [Hugging Face](https://huggingface.co/Qwen/Qwen3.6-27B) |
## 数据集
暂无
......@@ -55,9 +56,7 @@ docker run -it \
暂无
## 推理
### vllm
#### 单机推理
```bash
## serve启动
......@@ -104,16 +103,15 @@ curl http://localhost:8001/v1/chat/completions \
</div>
### 精度
测试数据:humaneval、gsm8k,使用的加速卡:bw1000。
- 推理框架:vllm
- 测试数据:humaneval、gsm8k
- 使用的加速卡:bw1000
| model name| humaneval | gsm8k |
| :------: | :------: | :------: |
| Qwen3.6-27B | 0.8293 | 0.98 |
| Qwen3.6-35B-A3B | 0.878 | 0.976 |
推理框架:vllm。
## 源码仓库及问题反馈
- https://developer.sourcefind.cn/codes/modelzoo/qwen3.6
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment