# Qwen3-30B-A3B_vllm
## 论文
`Qwen3 Technical Report`
- https://arxiv.org/abs/2505.09388
## 模型结构
Qwen3-30B-A3B(Qwen/Qwen3-30B-A3B-Instruct-2507)在一般能力方面有显著提高,包括遵循指令、逻辑推理、文本理解、数学、科学、编码和工具使用。
跨多种语言的长尾知识覆盖的实质性增长。
在主观和开放式任务中与用户偏好明显更好的对齐,从而实现更有帮助的响应和更高质量的文本生成。
增强了256K长上下文理解能力。
## 环境配置
### 硬件需求
DCU型号:K100_AI,节点数量:1台,卡数:2张。
### Docker(方法一)
```bash
docker pull image.sourcefind.cn:5000/dcu/admin/base/vllm:0.8.5-ubuntu22.04-dtk25.04.1-rc5-das1.6-py3.10-20250724
docker run -it --name {docker_name} --device=/dev/kfd --privileged --network=host --device=/dev/dri --cap-add=SYS_PTRACE --security-opt seccomp=unconfined -v /public/LLM-Models:/home/LLM-Models:ro -v /path/your_code_data/:/path/your_code_data/ -v /opt/hyhal:/opt/hyhal:ro --group-add video --shm-size 64G {imageID} bash
cd /your_code_path/qwen3-30b-a3b_vllm
```
### Dockerfile(方法二)
此处提供dockerfile的使用方法
```bash
cd docker
docker build --no-cache -t qwen3-30b-a3b:latest .
docker run -it --name {docker_name} --device=/dev/kfd --privileged --network=host --device=/dev/dri --cap-add=SYS_PTRACE --security-opt seccomp=unconfined -v /public/LLM-Models:/home/LLM-Models:ro -v /path/your_code_data/:/path/your_code_data/ -v /opt/hyhal:/opt/hyhal:ro --group-add video --shm-size 64G {imageID} bash
cd /your_code_path/qwen3-30b-a3b_vllm
```
### Anaconda(方法三)
关于本项目DCU显卡所需的特殊深度学习库可从[光合](https://developer.sourcefind.cn/tool/)开发者社区下载安装。
```bash
DTK: 25.04
python: 3.10
vllm: 0.8.5
torch: 2.4.1+das.opt1.dtk25041
```
`Tips:以上dtk驱动、torch等DCU相关工具版本需要严格一一对应`
其它非深度学习库安装方式如下:
```bash
pip install transformers==4.51.1
```
## 数据集
暂无
## 训练
暂无
## 推理
### vllm离线推理Qwen3-30B-A3B
```bash
## Qwen3-30B-A3B 在 BF16 精度下,其模型权重本身大约是 61 GB,至少需要双卡部署推理
export HIP_VISIBLE_DEVICES=6,7
## 模型地址参数
python ./infer/offline/infer_vllm.py --model /your_path/Qwen3-30B-A3B --tensor-parallel-size 2
```
## result
```
Original Input Prompt (if available):
'介绍一下北京.'
Generated text (full output):
'\n好的,用户让我介绍一下北京。首先,我需要确定用户的需求是什么。可能他们计划去旅游,或者需要写一篇关于北京的文章,或者只是对北京感兴趣。不管怎样,我需要提供全面而简洁的信息。\n\n接下来,我应该考虑北京的主要特点。作为中国的首都,北京有重要的政治地位,比如中南海和人民大会堂。然后是历史文化方面,北京有众多的古迹,比如故宫、长城、颐和园,这些都是必提的。还有现代元素,比如CBD、中关村,显示北京的现代化发展。\n\n然后,用户可能还想知道北京的地理位置、气候、交通、美食等。比如,北京属于温带季风气候,四季分明,可能需要提到季节性的旅游建议。交通方面,地铁系统很发达,还有首都国际机场。美食的话,烤鸭、炸酱面、豆汁儿这些特色食物应该提到。\n\n另外,北京作为国际大都市,可能有国际学校、外国使馆,以及举办过奥运会,这些也是亮点。可能需要提到北京的教育和科技资源,比如清华、北大,以及中关村的科技企业。\n\n还要注意用户可能的深层需求。比如,如果他们计划旅游,可能需要推荐景点和最佳旅游时间。如果是学生,可能对教育机构感兴趣。如果是商务人士,可能关注经济和交通。\n\n需要确保信息准确,比如北京的面积、人口数据,以及历史沿革,比如作为多个朝代的都城。同时,避免过时的信息,比如最新的发展情况,比如北京冬奥会的影响。\n\n最后,结构要清晰,分点介绍,但不要太生硬。语言要口语化,自然流畅,避免使用专业术语过多,让不同背景的用户都能理解。可能需要检查是否有遗漏的重要信息,比如北京的空气质量或环保措施,但可能用户更关注旅游和文化方面,所以可以简要提及。\n\n总结下来,我需要涵盖政治、历史、文化、现代发展、地理、气候、交通、美食等方面,确保全面且重点突出,同时保持回答的易读性和实用性。\n\n\n北京是中国的首都,也是世界著名古都和国际化大都市,拥有深厚的历史文化底蕴与现代化的城市风貌。以下是对北京的简要介绍:\n\n---\n\n### **1. 历史与文化**\n- **古都底蕴**:北京已有3000多年建城史,曾是元、明、清等朝代的都城,是中华文明的重要发源地之一。故宫、天坛、颐和园、长城等世界文化遗产,见证了其作为“帝王之都”的辉煌。\n- **文化中心**:北京是全国文化、教育、科技中心,拥有众多高校(如清华大学、北京大学)、博物馆(如国家博物馆、首都博物馆)和艺术机构,也是京剧、相声等传统文化的发源地。\n\n---\n\n### **2. 地理与气候**\n- **地理位置**:位于中国华北平原北端,背靠燕山,毗邻河北、天津,是连接华北与东北、西北的重要枢纽。\n- **气候特点**:属温带季风气候,四季分明,夏季炎热多雨,冬季寒冷干燥,春秋季短暂且多风沙。\n\n---\n\n### **3. 现代都市风貌**\n- **政治与经济**:作为中国的政治中心,中南海、人民大会堂等标志性建筑坐落于此;同时是经济、金融、科技高地,中关村聚集了众多科技企业,是“中国硅谷”。\n- **交通网络**:拥有发达的地铁系统(中国最密集的轨道交通之一)和首都国际机场,是全国铁路、航空枢纽。\n\n---\n\n### **4. 旅游景点**\n- **世界遗产**:长城(八达岭、慕田峪段)、故宫、颐和园、天坛、周口店北京人遗址等。\n- **现代地标**:国家体育场(鸟巢)、国家大剧院、央视大楼、三里屯、798艺术区等。\n- **自然风光**:香山红叶、十三陵水库、密云水库等。\n\n---\n\n### **5. 美食与生活**\n- **特色美食**:北京烤鸭(全聚德)、炸酱面、豆汁儿、卤煮、驴打滚等,小吃街如南锣鼓巷、簋街充满烟火气。\n- **生活节奏**:既有老北京的胡同文化(如南锣鼓巷、烟袋斜街),也有现代化的商圈(如国贸、金融街)。\n\n---\n\n### **6. 国际化与多元**\n- **国际交流**:北京是众多国际组织和外国使馆的所在地,也是2008年夏季奥运会和2022年冬季奥运会的举办城市。\n- **多元文化**:汇聚了来自世界各地的移民和留学生,形成了开放包容的城市氛围。\n\n---\n\n### **7. 挑战与机遇**\n- **环境问题**:曾面临雾霾等挑战,近年来通过治理空气质量、推广绿色能源等措施逐步改善。\n- **城市发展**:正通过“京津冀协同发展”战略,推动区域一体化,提升国际影响力。\n\n---\n\n北京是一座将历史与现代、传统与创新完美融合的城市,无论是探索古迹、感受文化,还是体验都市活力,都能找到独特的魅力。如果你有机会到访,不妨从故宫、长城开始,再深入胡同巷陌,感受这座城市的温度与故事。'
================================================================================
Logprobs per generated token:
Step 0:
- Generated Token: 151667 ('')
- Top Logprobs:
- Rank 1: Token 151667 ('') -> Logprob: -0.0000
- Rank 2: Token 32501 ('yped') -> Logprob: -16.6875
- Rank 3: Token 81218 (' zlib') -> Logprob: -17.5000
- Rank 4: Token 77899 (':len') -> Logprob: -17.9375
- Rank 5: Token 99048 (' zf') -> Logprob: -18.4375
- Rank 6: Token 117865 ('具体内容') -> Logprob: -18.5000
- Rank 7: Token 198 (' ') -> Logprob: -18.5625
- Rank 8: Token 18945 ('α') -> Logprob: -18.5625
- Rank 9: Token 67085 ('[param') -> Logprob: -19.0000
- Rank 10: Token 75025 ('yms') -> Logprob: -19.0000
...
...
成功将每个生成token的logprob写入到文件: ...
```
### 精度
```
# 分别在DCU和GPU上运行infer_vllm.py,得到各自的精度数据,并将精度数据复制粘贴到acc.py中运行
python ./infer/offline/acc.py
```
结果
```
Qwen3-30B-A3B在DCU(K100_AI)与GPU(A800)离线推理的平均绝对误差值:0.002905419914469576
```
DCU(K100_AI)与GPU(A800)离线推理Qwen3-30B-A3B精度一致,推理框架:vllm
### vllm离线推理Qwen3-30B-A3B-Instruct-2507
```bash
## Qwen3-30B-A3B-Instruct-2507 至少需要双卡部署推理
export HIP_VISIBLE_DEVICES=6,7
## 模型地址参数
python ./infer/offline/infer_vllm.py --model /your_path/Qwen3-30B-A3B-Instruct-2507 --tensor-parallel-size 2
```
## result
```
Original Input Prompt (if available):
'介绍一下北京.'
Generated text (full output):
'北京,简称“京”,是中国的首都,也是中华人民共和国的中央人民政府所在地,是全国的政治、文化、教育和国际交往中心。它位于中国华北平原的北部,地处燕山山脉与华北平原的交汇地带,地理坐标为北纬39°54′,东经116°23′,总面积约16,410平方公里。\n\n### 历史与文化\n北京拥有超过3000年的建城史和800多年的建都史,是中国历史上多个朝代的都城。自元朝起,北京成为全国的政治中心,明清两代在此建都,留下了大量珍贵的历史文化遗产。北京是世界著名的历史文化名城,拥有众多世界文化遗产,如:\n\n- **故宫**(紫禁城):明清两代的皇家宫殿,是世界上现存规模最大、保存最完整的古代宫殿建筑群。\n- **天坛**:明清皇帝祭天祈谷的场所,建筑布局严谨,象征“天圆地方”。\n- **颐和园**:中国现存规模最大、保存最完整的皇家园林,融合了自然景观与人工建筑。\n- **八达岭长城**:万里长城的代表段落,是世界文化遗产之一,也是中外游客必访之地。\n- **圆明园遗址**:曾被誉为“万园之园”,虽在第二次鸦片战争中被焚毁,但遗址仍具重要历史价值。\n- **天安门广场**:世界上最大的城市广场之一,是北京的象征性地标,也是国家举行重大庆典和政治活动的场所。\n\n### 城市风貌与现代发展\n北京是一座传统与现代交融的城市。在保留古都风貌的同时,也展现出高度现代化的城市面貌:\n\n- **城市布局**:以中轴线为核心,呈对称布局,从永定门到钟鼓楼,贯穿城市南北,体现了中国古代城市规划的智慧。\n- **现代地标**:国家大剧院(“蛋”)、中央电视台总部大楼(“大裤衩”)、北京国贸大厦、北京SKP等现代建筑彰显了城市的国际化形象。\n- **交通系统**:拥有发达的轨道交通网络,北京地铁是全球运营里程最长的城市地铁系统之一,覆盖全市主要区域。\n\n### 教育与科技\n北京是中国高等教育和科研的中心,拥有众多顶尖高校和研究机构,如:\n\n- 清华大学\n- 北京大学\n- 中国科学院\n- 中国工程院\n\n这些机构在科技、工程、医学、人文等领域具有国际影响力。\n\n### 旅游与美食\n北京是国内外游客向往的旅游目的地,每年吸引数千万游客。除了上述名胜古迹,还有:\n\n- **胡同与四合院**:如南锣鼓巷、什刹海,是体验老北京生活文化的窗口。\n- **北京烤鸭**:享誉世界的特色美食,以全聚德、便宜坊为代表。\n- **豆汁儿、焦圈、炸酱面、艾窝窝**等传统小吃也极具地方特色。\n\n### 环境与生态\n近年来,北京大力推进生态文明建设,实施“蓝天保卫战”,空气质量持续改善。城市绿化覆盖率不断提高,拥有奥林匹克森林公园、北京植物园、香山公园等大型生态空间。\n\n### 总结\n北京是一座集历史厚重感与现代活力于一体的城市,既是中华文明的重要象征,也是中国走向世界的重要窗口。无论你是追寻历史足迹,还是感受现代都市魅力,北京都能为你带来深刻而难忘的体验。'
================================================================================
Logprobs per generated token:
Step 0:
- Generated Token: 68990 ('北京')
- Top Logprobs:
- Rank 1: Token 68990 ('北京') -> Logprob: -0.0019
- Rank 2: Token 103942 ('当然') -> Logprob: -6.2519
- Rank 3: Token 104554 ('北京市') -> Logprob: -11.3769
- Rank 4: Token 99692 ('好的') -> Logprob: -13.5019
- Rank 5: Token 108386 ('你好') -> Logprob: -13.5019
- Rank 6: Token 111308 ('您好') -> Logprob: -14.1269
- Rank 7: Token 106287 ('嗯') -> Logprob: -15.2519
- Rank 8: Token 106114 ('首都') -> Logprob: -16.8769
- Rank 9: Token 110488 ('北京时间') -> Logprob: -16.8769
- Rank 10: Token 334 ('**') -> Logprob: -17.3769
...
...
成功将每个生成token的logprob写入到文件: ...
```
### 精度
```
# 分别在DCU和GPU上运行infer_vllm.py,得到各自的精度数据,并将精度数据复制粘贴到acc.py中运行
python ./infer/offline/acc.py
```
结果
```
Qwen3-30B-A3B-Instruct-2507在DCU(K100_AI)与GPU(A800)离线推理的平均绝对误差值:0.006542379854522551
```
DCU(K100_AI)与GPU(A800)离线推理Qwen3-30B-A3B-Instruct-2507精度一致,推理框架:vllm
### vllm在线推理Qwen3-30B-A3B
```bash
## Qwen3-30B-A3B 至少需要双卡部署
export HIP_VISIBLE_DEVICES=6,7
## 启动服务
vllm serve /your_path/Qwen3-30B-A3B --enable-reasoning --reasoning-parser deepseek_r1 --tensor-parallel-size 2 --max-logprobs 10
## 修改./infer/online/client.py, MODEL_NAME请改成/your_path/Qwen3-30B-A3B,并运行client.py, 代码内部共设置十个提示词
python client.py
```
## result
```
欢迎使用 Qwen3-30B-A3B 聊天客户端!
已连接到 vLLM 服务,使用模型: /home/zwq/model/Qwen3-30B-A3B
--------------------------------------------------
--- 问题 1: '介绍一下北京.' ---
完整回答 (包含思考): '\n\n北京是中国的首都,也是世界著名古都和国际化大都市,拥有深厚的历史文化底蕴与现代化的城市风貌。以下从多个角度为您简要介绍:\n\n---\n\n### **1. 历史与文化**\n- **古都底蕴**:北京已有3000多年建城史,曾是元、明、清三朝的都城,是中华文明的重要发源地之一。故宫、天坛、颐和园、长城等世界文化遗产,见证了中国古代建筑与文化的辉煌。\n- **胡同与四合院**:老北京的典型民居形式,如南锣鼓巷、烟袋斜街等胡同区,保留了传统市井文化。\n- **文化地标**:国家博物馆、中国美术馆、首都博物馆等机构汇聚了丰富的文物与艺术资源。\n\n---\n\n### **2. 政治与经济中心**\n- **政治核心**:中南海(中共中央和国务院所在地)、人民大会堂(全国人大和政协会议场所)等是国家政治决策的核心区域。\n- **经济枢纽**:作为中国四大直辖市之一,北京是科技创新、金融、教育和文化中心,拥有中关村科技园区、金融街等重要经济区域。\n\n---\n\n### **3. 现代都市风貌**\n- **地标建筑**:央视大楼、国贸三期、北京大兴国际机场等现代化建筑展现了城市活力。\n- **交通网络**:地铁系统发达(中国最长的地铁线路之一),拥有首都国际机场和大兴国际机场,是全国航空枢纽。\n- **绿色空间**:奥林匹克公园、景山公园、北海公园等为城市增添生态气息。\n\n---\n\n### **4. 美食与生活**\n- **特色美食**:北京烤鸭(全聚德)、炸酱面、豆汁儿、卤煮火烧等传统小吃,以及各种京味儿餐馆。\n- **市井文化**:王府井、西单等商圈汇聚购物与餐饮,而胡同里的老茶馆、相声表演则体现市井生活。\n\n---\n\n### **5. 旅游与四季风光**\n- **经典景点**:故宫(紫禁城)、长城(八达岭/慕田峪)、颐和园、天坛、圆明园等。\n- **四季特色**:\n - **春**:玉渊潭樱花、植物园桃花。\n - **夏**:北海荷花、香山红叶(秋)。\n - **秋**:香山红叶、京郊红叶谷。\n - **冬**:北海冰场、滑雪场。\n\n---\n\n### **6. 教育与科技**\n- **高校云集**:清华大学、北京大学、中国人民大学等顶尖学府,是中国高等教育的高地。\n- **科技创新**:中关村是中国科技创新的“硅谷”,聚集了大量互联网、人工智能企业。\n\n---\n\n### **7. 体育与国际活动**\n- **奥运之城**:2008年夏季奥运会和2022年冬季奥运会的举办地,拥有鸟巢、水立方等标志性场馆。\n- **国际赛事**:承办过亚运会、世界田径锦标赛等大型国际赛事。\n\n---\n\n北京是一座将历史与现代、传统与创新完美融合的城市,既有厚重的文化积淀,又充满活力与未来感。无论是探索古迹、感受文化,还是体验现代都市生活,北京都能带来独特的魅力。'
【主要回答】: '\n\n北京是中国的首都,也是世界著名古都和国际化大都市,拥有深厚的历史文化底蕴与现代化的城市风貌。以下从多个角度为您简要介绍:\n\n---\n\n### **1. 历史与文化**\n- **古都底蕴**:北京已有3000多年建城史,曾是元、明、清三朝的都城,是中华文明的重要发源地之一。故宫、天坛、颐和园、长城等世界文化遗产,见证了中国古代建筑与文化的辉煌。\n- **胡同与四合院**:老北京的典型民居形式,如南锣鼓巷、烟袋斜街等胡同区,保留了传统市井文化。\n- **文化地标**:国家博物馆、中国美术馆、首都博物馆等机构汇聚了丰富的文物与艺术资源。\n\n---\n\n### **2. 政治与经济中心**\n- **政治核心**:中南海(中共中央和国务院所在地)、人民大会堂(全国人大和政协会议场所)等是国家政治决策的核心区域。\n- **经济枢纽**:作为中国四大直辖市之一,北京是科技创新、金融、教育和文化中心,拥有中关村科技园区、金融街等重要经济区域。\n\n---\n\n### **3. 现代都市风貌**\n- **地标建筑**:央视大楼、国贸三期、北京大兴国际机场等现代化建筑展现了城市活力。\n- **交通网络**:地铁系统发达(中国最长的地铁线路之一),拥有首都国际机场和大兴国际机场,是全国航空枢纽。\n- **绿色空间**:奥林匹克公园、景山公园、北海公园等为城市增添生态气息。\n\n---\n\n### **4. 美食与生活**\n- **特色美食**:北京烤鸭(全聚德)、炸酱面、豆汁儿、卤煮火烧等传统小吃,以及各种京味儿餐馆。\n- **市井文化**:王府井、西单等商圈汇聚购物与餐饮,而胡同里的老茶馆、相声表演则体现市井生活。\n\n---\n\n### **5. 旅游与四季风光**\n- **经典景点**:故宫(紫禁城)、长城(八达岭/慕田峪)、颐和园、天坛、圆明园等。\n- **四季特色**:\n - **春**:玉渊潭樱花、植物园桃花。\n - **夏**:北海荷花、香山红叶(秋)。\n - **秋**:香山红叶、京郊红叶谷。\n - **冬**:北海冰场、滑雪场。\n\n---\n\n### **6. 教育与科技**\n- **高校云集**:清华大学、北京大学、中国人民大学等顶尖学府,是中国高等教育的高地。\n- **科技创新**:中关村是中国科技创新的“硅谷”,聚集了大量互联网、人工智能企业。\n\n---\n\n### **7. 体育与国际活动**\n- **奥运之城**:2008年夏季奥运会和2022年冬季奥运会的举办地,拥有鸟巢、水立方等标志性场馆。\n- **国际赛事**:承办过亚运会、世界田径锦标赛等大型国际赛事。\n\n---\n\n北京是一座将历史与现代、传统与创新完美融合的城市,既有厚重的文化积淀,又充满活力与未来感。无论是探索古迹、感受文化,还是体验现代都市生活,北京都能带来独特的魅力。'
答案部分前10个Token的Rank 1 Logprobs:
Step 0: 0.0000
Step 1: -0.0000
Step 2: -0.0711
Step 3: -0.0000
Step 4: -0.1086
Step 5: -0.0150
Step 6: -0.0067
Step 7: -0.0000
Step 8: -0.0298
Step 9: -0.0091
--------------------------------------------------
......
......
所有测试结果已保存到文件: ./Qwen3-30B-A3B_logprobs_K100AI_fp16.json
```
### 精度
```bash
## 分别在DCU和GPU上启动vllm服务,并对应运行client.py,得到各自的精度数据后,运行online文件夹下的acc.py
python ./infer/online/acc.py --file1 /your_path/Qwen3-30B-A3B_logprobs_A800_fp16.json --file2 /your_path/Qwen3-30B-A3B_logprobs_K100AI_fp16.json
```
结果
```
提示词:介绍一下北京.,平均绝对误差:0.002455742455325094
提示词:写一首关于春天的五言绝句.,平均绝对误差:0.0007630783482369452
提示词:请解释一下黑洞的形成原理.,平均绝对误差:0.005167613880542632
提示词:推荐三部值得一看的科幻电影,并简述理由.,平均绝对误差:0.0030238355811320616
提示词:如何有效提高编程能力?,平均绝对误差:0.014263489465471934
提示词:给我讲一个关于人工智能的笑话.,平均绝对误差:0.003418742059113811
提示词:你认为未来教育会发展成什么样?,平均绝对误差:0.0246062334959511
提示词:如何制作一道美味的麻婆豆腐?,平均绝对误差:0.005538759729023468
提示词:量子计算的原理是什么?它有哪些潜在应用?,平均绝对误差:0.012481686085721578
提示词:请用英语介绍一下中国长城.,平均绝对误差:0.001114922351905534
总体平均绝对误差:7.283410e-03
```
DCU(K100_AI)与GPU(A800)在线推理Qwen3-30B-A3B精度一致,推理框架:vllm
## 应用场景
### 算法类别
`对话`
### 热点应用行业
`金融,教育,政府,科研,制造,能源,交通`
## 预训练权重
- [Qwen/Qwen3-30B-A3B](https://huggingface.co/Qwen/Qwen3-30B-A3B)
- [Qwen/Qwen3-30B-A3B-Instruct-2507](https://huggingface.co/Qwen/Qwen3-30B-A3B-Instruct-2507)
## 源码仓库及问题反馈
- https://developer.sourcefind.cn/codes/modelzoo/qwen3-30b-a3b_vllm
## 参考资料
- https://huggingface.co/Qwen/Qwen3-30B-A3B
- https://huggingface.co/Qwen/Qwen3-30B-A3B-Instruct-2507