# Qwen3-30B-A3B_vllm ## 论文 `Qwen3 Technical Report` - https://arxiv.org/abs/2505.09388 `Qwen2.5-1M Technical Report` - https://arxiv.org/abs/2501.15383 ## 模型结构 Qwen3-30B-A3B、Qwen3-30B-A3B-Instruct-2507在一般能力方面有显著提高,包括遵循指令、逻辑推理、文本理解、数学、科学、编码和工具使用。 跨多种语言的长尾知识覆盖的实质性增长。在主观和开放式任务中与用户偏好明显更好的对齐,从而实现更有帮助的响应和更高质量的文本生成。 增强了256K长上下文理解能力。
## 算法原理 ## 环境配置 ### 硬件需求 DCU型号:K100_AI,节点数量:1台,卡数:2张。 ### Docker(方法一) ```bash docker pull image.sourcefind.cn:5000/dcu/admin/base/vllm:0.8.5-ubuntu22.04-dtk25.04.1-rc5-das1.6-py3.10-20250724 docker run -it --name {docker_name} --device=/dev/kfd --privileged --network=host --device=/dev/dri --cap-add=SYS_PTRACE --security-opt seccomp=unconfined -v /public/LLM-Models:/home/LLM-Models:ro -v /path/your_code_data/:/path/your_code_data/ -v /opt/hyhal:/opt/hyhal:ro --group-add video --shm-size 64G {imageID} bash cd /your_code_path/qwen3-30b-a3b_vllm ``` ### Dockerfile(方法二) 此处提供dockerfile的使用方法 ```bash cd docker docker build --no-cache -t qwen3-30b-a3b:latest . docker run -it --name {docker_name} --device=/dev/kfd --privileged --network=host --device=/dev/dri --cap-add=SYS_PTRACE --security-opt seccomp=unconfined -v /public/LLM-Models:/home/LLM-Models:ro -v /path/your_code_data/:/path/your_code_data/ -v /opt/hyhal:/opt/hyhal:ro --group-add video --shm-size 64G {imageID} bash cd /your_code_path/qwen3-30b-a3b_vllm ``` ### Anaconda(方法三) 关于本项目DCU显卡所需的特殊深度学习库可从[光合](https://developer.sourcefind.cn/tool/)开发者社区下载安装。 ```bash DTK: 25.04 python: 3.10 vllm: 0.8.5 torch: 2.4.1+das.opt1.dtk25041 ``` `Tips:以上dtk驱动、torch等DCU相关工具版本需要严格一一对应` 其它非深度学习库安装方式如下: ```bash pip install transformers==4.51.1 ``` ## 数据集 暂无 ## 训练 暂无 ## 推理 ### vllm离线推理Qwen3-30B-A3B ```bash ## Qwen3-30B-A3B 在 BF16 精度下,其模型权重本身大约是 61 GB,至少需要双卡部署推理 export HIP_VISIBLE_DEVICES=6,7 ## 模型地址参数 python ./infer/offline/infer_vllm.py --model /your_path/Qwen3-30B-A3B --tensor-parallel-size 2 ``` ## result ``` Original Input Prompt (if available): '介绍一下北京.' Generated text (full output): '\n好的,用户让我介绍一下北京。首先,我需要确定用户的需求是什么。可能他们计划去旅游,或者需要写一篇关于北京的文章,或者只是对北京感兴趣。不管怎样,我需要提供全面而简洁的信息。\n\n接下来,我应该考虑北京的主要特点。作为中国的首都,北京有重要的政治地位,比如中南海和人民大会堂。然后是历史文化方面,北京有众多的古迹,比如故宫、长城、颐和园,这些都是必提的。还有现代元素,比如CBD、中关村,显示北京的现代化发展。\n\n然后,用户可能还想知道北京的地理位置、气候、交通、美食等。比如,北京属于温带季风气候,四季分明,可能需要提到季节性的旅游建议。交通方面,地铁系统很发达,还有首都国际机场。美食的话,烤鸭、炸酱面、豆汁儿这些特色食物应该提到。\n\n另外,北京作为国际大都市,可能有国际学校、外国使馆,以及举办过奥运会,这些也是亮点。可能需要提到北京的教育和科技资源,比如清华、北大,以及中关村的科技企业。\n\n还要注意用户可能的深层需求。比如,如果他们计划旅游,可能需要推荐景点和最佳旅游时间。如果是学生,可能对教育机构感兴趣。如果是商务人士,可能关注经济和交通。\n\n需要确保信息准确,比如北京的面积、人口数据,以及历史沿革,比如作为多个朝代的都城。同时,避免过时的信息,比如最新的发展情况,比如北京冬奥会的影响。\n\n最后,结构要清晰,分点介绍,但不要太生硬。语言要口语化,自然流畅,避免使用专业术语过多,让不同背景的用户都能理解。可能需要检查是否有遗漏的重要信息,比如北京的空气质量或环保措施,但可能用户更关注旅游和文化方面,所以可以简要提及。\n\n总结下来,我需要涵盖政治、历史、文化、现代发展、地理、气候、交通、美食等方面,确保全面且重点突出,同时保持回答的易读性和实用性。\n\n\n北京是中国的首都,也是世界著名古都和国际化大都市,拥有深厚的历史文化底蕴与现代化的城市风貌。以下是对北京的简要介绍:\n\n---\n\n### **1. 历史与文化**\n- **古都底蕴**:北京已有3000多年建城史,曾是元、明、清等朝代的都城,是中华文明的重要发源地之一。故宫、天坛、颐和园、长城等世界文化遗产,见证了其作为“帝王之都”的辉煌。\n- **文化中心**:北京是全国文化、教育、科技中心,拥有众多高校(如清华大学、北京大学)、博物馆(如国家博物馆、首都博物馆)和艺术机构,也是京剧、相声等传统文化的发源地。\n\n---\n\n### **2. 地理与气候**\n- **地理位置**:位于中国华北平原北端,背靠燕山,毗邻河北、天津,是连接华北与东北、西北的重要枢纽。\n- **气候特点**:属温带季风气候,四季分明,夏季炎热多雨,冬季寒冷干燥,春秋季短暂且多风沙。\n\n---\n\n### **3. 现代都市风貌**\n- **政治与经济**:作为中国的政治中心,中南海、人民大会堂等标志性建筑坐落于此;同时是经济、金融、科技高地,中关村聚集了众多科技企业,是“中国硅谷”。\n- **交通网络**:拥有发达的地铁系统(中国最密集的轨道交通之一)和首都国际机场,是全国铁路、航空枢纽。\n\n---\n\n### **4. 旅游景点**\n- **世界遗产**:长城(八达岭、慕田峪段)、故宫、颐和园、天坛、周口店北京人遗址等。\n- **现代地标**:国家体育场(鸟巢)、国家大剧院、央视大楼、三里屯、798艺术区等。\n- **自然风光**:香山红叶、十三陵水库、密云水库等。\n\n---\n\n### **5. 美食与生活**\n- **特色美食**:北京烤鸭(全聚德)、炸酱面、豆汁儿、卤煮、驴打滚等,小吃街如南锣鼓巷、簋街充满烟火气。\n- **生活节奏**:既有老北京的胡同文化(如南锣鼓巷、烟袋斜街),也有现代化的商圈(如国贸、金融街)。\n\n---\n\n### **6. 国际化与多元**\n- **国际交流**:北京是众多国际组织和外国使馆的所在地,也是2008年夏季奥运会和2022年冬季奥运会的举办城市。\n- **多元文化**:汇聚了来自世界各地的移民和留学生,形成了开放包容的城市氛围。\n\n---\n\n### **7. 挑战与机遇**\n- **环境问题**:曾面临雾霾等挑战,近年来通过治理空气质量、推广绿色能源等措施逐步改善。\n- **城市发展**:正通过“京津冀协同发展”战略,推动区域一体化,提升国际影响力。\n\n---\n\n北京是一座将历史与现代、传统与创新完美融合的城市,无论是探索古迹、感受文化,还是体验都市活力,都能找到独特的魅力。如果你有机会到访,不妨从故宫、长城开始,再深入胡同巷陌,感受这座城市的温度与故事。' ================================================================================ Logprobs per generated token: Step 0: - Generated Token: 151667 ('') - Top Logprobs: - Rank 1: Token 151667 ('') -> Logprob: -0.0000 - Rank 2: Token 32501 ('yped') -> Logprob: -16.6875 - Rank 3: Token 81218 (' zlib') -> Logprob: -17.5000 - Rank 4: Token 77899 (':len') -> Logprob: -17.9375 - Rank 5: Token 99048 (' zf') -> Logprob: -18.4375 - Rank 6: Token 117865 ('具体内容') -> Logprob: -18.5000 - Rank 7: Token 198 (' ') -> Logprob: -18.5625 - Rank 8: Token 18945 ('α') -> Logprob: -18.5625 - Rank 9: Token 67085 ('[param') -> Logprob: -19.0000 - Rank 10: Token 75025 ('yms') -> Logprob: -19.0000 ... ... 成功将每个生成token的logprob写入到文件: ... ``` ### 精度 ``` # 分别在DCU和GPU上运行infer_vllm.py,得到各自的精度数据,并将精度数据复制粘贴到acc.py中运行 python ./infer/offline/acc.py ``` 结果 ``` Qwen3-30B-A3B在DCU(K100_AI)与GPU(A800)离线推理的平均绝对误差值:0.002905419914469576 ``` DCU(K100_AI)与GPU(A800)离线推理Qwen3-30B-A3B精度一致,推理框架:vllm ### vllm离线推理Qwen3-30B-A3B-Instruct-2507 ```bash ## Qwen3-30B-A3B-Instruct-2507 至少需要双卡部署推理 export HIP_VISIBLE_DEVICES=6,7 ## 模型地址参数 python ./infer/offline/infer_vllm.py --model /your_path/Qwen3-30B-A3B-Instruct-2507 --tensor-parallel-size 2 ``` ## result ``` Original Input Prompt (if available): '介绍一下北京.' Generated text (full output): '北京,简称“京”,是中国的首都,也是中华人民共和国的中央人民政府所在地,是全国的政治、文化、教育和国际交往中心。它位于中国华北平原的北部,地处燕山山脉与华北平原的交汇地带,地理坐标为北纬39°54′,东经116°23′,总面积约16,410平方公里。\n\n### 历史与文化\n北京拥有超过3000年的建城史和800多年的建都史,是中国历史上多个朝代的都城。自元朝起,北京成为全国的政治中心,明清两代在此建都,留下了大量珍贵的历史文化遗产。北京是世界著名的历史文化名城,拥有众多世界文化遗产,如:\n\n- **故宫**(紫禁城):明清两代的皇家宫殿,是世界上现存规模最大、保存最完整的古代宫殿建筑群。\n- **天坛**:明清皇帝祭天祈谷的场所,建筑布局严谨,象征“天圆地方”。\n- **颐和园**:中国现存规模最大、保存最完整的皇家园林,融合了自然景观与人工建筑。\n- **八达岭长城**:万里长城的代表段落,是世界文化遗产之一,也是中外游客必访之地。\n- **圆明园遗址**:曾被誉为“万园之园”,虽在第二次鸦片战争中被焚毁,但遗址仍具重要历史价值。\n- **天安门广场**:世界上最大的城市广场之一,是北京的象征性地标,也是国家举行重大庆典和政治活动的场所。\n\n### 城市风貌与现代发展\n北京是一座传统与现代交融的城市。在保留古都风貌的同时,也展现出高度现代化的城市面貌:\n\n- **城市布局**:以中轴线为核心,呈对称布局,从永定门到钟鼓楼,贯穿城市南北,体现了中国古代城市规划的智慧。\n- **现代地标**:国家大剧院(“蛋”)、中央电视台总部大楼(“大裤衩”)、北京国贸大厦、北京SKP等现代建筑彰显了城市的国际化形象。\n- **交通系统**:拥有发达的轨道交通网络,北京地铁是全球运营里程最长的城市地铁系统之一,覆盖全市主要区域。\n\n### 教育与科技\n北京是中国高等教育和科研的中心,拥有众多顶尖高校和研究机构,如:\n\n- 清华大学\n- 北京大学\n- 中国科学院\n- 中国工程院\n\n这些机构在科技、工程、医学、人文等领域具有国际影响力。\n\n### 旅游与美食\n北京是国内外游客向往的旅游目的地,每年吸引数千万游客。除了上述名胜古迹,还有:\n\n- **胡同与四合院**:如南锣鼓巷、什刹海,是体验老北京生活文化的窗口。\n- **北京烤鸭**:享誉世界的特色美食,以全聚德、便宜坊为代表。\n- **豆汁儿、焦圈、炸酱面、艾窝窝**等传统小吃也极具地方特色。\n\n### 环境与生态\n近年来,北京大力推进生态文明建设,实施“蓝天保卫战”,空气质量持续改善。城市绿化覆盖率不断提高,拥有奥林匹克森林公园、北京植物园、香山公园等大型生态空间。\n\n### 总结\n北京是一座集历史厚重感与现代活力于一体的城市,既是中华文明的重要象征,也是中国走向世界的重要窗口。无论你是追寻历史足迹,还是感受现代都市魅力,北京都能为你带来深刻而难忘的体验。' ================================================================================ Logprobs per generated token: Step 0: - Generated Token: 68990 ('北京') - Top Logprobs: - Rank 1: Token 68990 ('北京') -> Logprob: -0.0019 - Rank 2: Token 103942 ('当然') -> Logprob: -6.2519 - Rank 3: Token 104554 ('北京市') -> Logprob: -11.3769 - Rank 4: Token 99692 ('好的') -> Logprob: -13.5019 - Rank 5: Token 108386 ('你好') -> Logprob: -13.5019 - Rank 6: Token 111308 ('您好') -> Logprob: -14.1269 - Rank 7: Token 106287 ('嗯') -> Logprob: -15.2519 - Rank 8: Token 106114 ('首都') -> Logprob: -16.8769 - Rank 9: Token 110488 ('北京时间') -> Logprob: -16.8769 - Rank 10: Token 334 ('**') -> Logprob: -17.3769 ... ... 成功将每个生成token的logprob写入到文件: ... ``` ### 精度 ``` # 分别在DCU和GPU上运行infer_vllm.py,得到各自的精度数据,并将精度数据复制粘贴到acc.py中运行 python ./infer/offline/acc.py ``` 结果 ``` Qwen3-30B-A3B-Instruct-2507在DCU(K100_AI)与GPU(A800)离线推理的平均绝对误差值:0.006542379854522551 ``` DCU(K100_AI)与GPU(A800)离线推理Qwen3-30B-A3B-Instruct-2507精度一致,推理框架:vllm ### vllm离线推理Qwen3-30B-A3B-Thinking-2507 ```bash ## Qwen3-30B-A3B-Thinking-2507 至少需要双卡部署推理 export HIP_VISIBLE_DEVICES=6,7 ## 模型地址参数 python ./infer/offline/infer_vllm.py --model /your_path/Qwen3-30B-A3B-Thinking-2507 --tensor-parallel-size 2 ``` ## result ``` Original Input Prompt (if available): '介绍一下北京.' Generated text (full output): '嗯,用户让我介绍一下北京。首先得确定用户的需求是什么。 ...... ...... ......' ================================================================================ Logprobs per generated token: Step 0: - Generated Token: 106287 ('嗯') - Top Logprobs: - Rank 1: Token 106287 ('嗯') -> Logprob: -0.0134 - Rank 2: Token 32313 ('Okay') -> Logprob: -4.3884 - Rank 3: Token 99692 ('好的') -> Logprob: -7.0134 - Rank 4: Token 80022 ('Hmm') -> Logprob: -11.3884 - Rank 5: Token 110115 ('好吧') -> Logprob: -11.6384 - Rank 6: Token 11395 ('Well') -> Logprob: -13.0134 - Rank 7: Token 52801 ('好') -> Logprob: -13.0134 - Rank 8: Token 101140 ('首先') -> Logprob: -13.3884 - Rank 9: Token 71486 ('Alright') -> Logprob: -13.5134 - Rank 10: Token 2461 ('For') -> Logprob: -14.0134 ... ... 成功将每个生成token的logprob写入到文件: ... ``` ### 精度 ``` # 分别在DCU和GPU上运行infer_vllm.py,得到各自的精度数据,并将精度数据复制粘贴到acc.py中运行 python ./infer/offline/acc.py ``` 结果 ``` Qwen3-30B-A3B-Thinking-2507在DCU(K100_AI)与GPU(A800)离线推理的平均绝对误差值:0.01841533068222816 ``` DCU(K100_AI)与GPU(A800)离线推理Qwen3-30B-A3B-Thinking-2507精度一致,推理框架:vllm ### vllm在线推理Qwen3-30B-A3B ```bash ## Qwen3-30B-A3B 至少需要双卡部署 export HIP_VISIBLE_DEVICES=6,7 ## 启动服务 vllm serve /your_path/Qwen3-30B-A3B --enable-reasoning --reasoning-parser deepseek_r1 --tensor-parallel-size 2 --max-logprobs 10 ## 修改./infer/online/client.py, MODEL_NAME请改成/your_path/Qwen3-30B-A3B,并运行client.py, 代码内部共设置十个提示词 python client.py ``` ## result ``` 欢迎使用 Qwen3-30B-A3B 聊天客户端! 已连接到 vLLM 服务,使用模型: /home/zwq/model/Qwen3-30B-A3B -------------------------------------------------- --- 问题 1: '介绍一下北京.' --- 完整回答 (包含思考): '\n\n北京是中国的首都,也是世界著名古都和国际化大都市,拥有深厚的历史文化底蕴与现代化的城市风貌。以下从多个角度为您简要介绍:\n\n---\n\n### **1. 历史与文化**\n- **古都底蕴**:北京已有3000多年建城史,曾是元、明、清三朝的都城,是中华文明的重要发源地之一。故宫、天坛、颐和园、长城等世界文化遗产,见证了中国古代建筑与文化的辉煌。\n- **胡同与四合院**:老北京的典型民居形式,如南锣鼓巷、烟袋斜街等胡同区,保留了传统市井文化。\n- **文化地标**:国家博物馆、中国美术馆、首都博物馆等机构汇聚了丰富的文物与艺术资源。\n\n---\n\n### **2. 政治与经济中心**\n- **政治核心**:中南海(中共中央和国务院所在地)、人民大会堂(全国人大和政协会议场所)等是国家政治决策的核心区域。\n- **经济枢纽**:作为中国四大直辖市之一,北京是科技创新、金融、教育和文化中心,拥有中关村科技园区、金融街等重要经济区域。\n\n---\n\n### **3. 现代都市风貌**\n- **地标建筑**:央视大楼、国贸三期、北京大兴国际机场等现代化建筑展现了城市活力。\n- **交通网络**:地铁系统发达(中国最长的地铁线路之一),拥有首都国际机场和大兴国际机场,是全国航空枢纽。\n- **绿色空间**:奥林匹克公园、景山公园、北海公园等为城市增添生态气息。\n\n---\n\n### **4. 美食与生活**\n- **特色美食**:北京烤鸭(全聚德)、炸酱面、豆汁儿、卤煮火烧等传统小吃,以及各种京味儿餐馆。\n- **市井文化**:王府井、西单等商圈汇聚购物与餐饮,而胡同里的老茶馆、相声表演则体现市井生活。\n\n---\n\n### **5. 旅游与四季风光**\n- **经典景点**:故宫(紫禁城)、长城(八达岭/慕田峪)、颐和园、天坛、圆明园等。\n- **四季特色**:\n - **春**:玉渊潭樱花、植物园桃花。\n - **夏**:北海荷花、香山红叶(秋)。\n - **秋**:香山红叶、京郊红叶谷。\n - **冬**:北海冰场、滑雪场。\n\n---\n\n### **6. 教育与科技**\n- **高校云集**:清华大学、北京大学、中国人民大学等顶尖学府,是中国高等教育的高地。\n- **科技创新**:中关村是中国科技创新的“硅谷”,聚集了大量互联网、人工智能企业。\n\n---\n\n### **7. 体育与国际活动**\n- **奥运之城**:2008年夏季奥运会和2022年冬季奥运会的举办地,拥有鸟巢、水立方等标志性场馆。\n- **国际赛事**:承办过亚运会、世界田径锦标赛等大型国际赛事。\n\n---\n\n北京是一座将历史与现代、传统与创新完美融合的城市,既有厚重的文化积淀,又充满活力与未来感。无论是探索古迹、感受文化,还是体验现代都市生活,北京都能带来独特的魅力。' 【主要回答】: '\n\n北京是中国的首都,也是世界著名古都和国际化大都市,拥有深厚的历史文化底蕴与现代化的城市风貌。以下从多个角度为您简要介绍:\n\n---\n\n### **1. 历史与文化**\n- **古都底蕴**:北京已有3000多年建城史,曾是元、明、清三朝的都城,是中华文明的重要发源地之一。故宫、天坛、颐和园、长城等世界文化遗产,见证了中国古代建筑与文化的辉煌。\n- **胡同与四合院**:老北京的典型民居形式,如南锣鼓巷、烟袋斜街等胡同区,保留了传统市井文化。\n- **文化地标**:国家博物馆、中国美术馆、首都博物馆等机构汇聚了丰富的文物与艺术资源。\n\n---\n\n### **2. 政治与经济中心**\n- **政治核心**:中南海(中共中央和国务院所在地)、人民大会堂(全国人大和政协会议场所)等是国家政治决策的核心区域。\n- **经济枢纽**:作为中国四大直辖市之一,北京是科技创新、金融、教育和文化中心,拥有中关村科技园区、金融街等重要经济区域。\n\n---\n\n### **3. 现代都市风貌**\n- **地标建筑**:央视大楼、国贸三期、北京大兴国际机场等现代化建筑展现了城市活力。\n- **交通网络**:地铁系统发达(中国最长的地铁线路之一),拥有首都国际机场和大兴国际机场,是全国航空枢纽。\n- **绿色空间**:奥林匹克公园、景山公园、北海公园等为城市增添生态气息。\n\n---\n\n### **4. 美食与生活**\n- **特色美食**:北京烤鸭(全聚德)、炸酱面、豆汁儿、卤煮火烧等传统小吃,以及各种京味儿餐馆。\n- **市井文化**:王府井、西单等商圈汇聚购物与餐饮,而胡同里的老茶馆、相声表演则体现市井生活。\n\n---\n\n### **5. 旅游与四季风光**\n- **经典景点**:故宫(紫禁城)、长城(八达岭/慕田峪)、颐和园、天坛、圆明园等。\n- **四季特色**:\n - **春**:玉渊潭樱花、植物园桃花。\n - **夏**:北海荷花、香山红叶(秋)。\n - **秋**:香山红叶、京郊红叶谷。\n - **冬**:北海冰场、滑雪场。\n\n---\n\n### **6. 教育与科技**\n- **高校云集**:清华大学、北京大学、中国人民大学等顶尖学府,是中国高等教育的高地。\n- **科技创新**:中关村是中国科技创新的“硅谷”,聚集了大量互联网、人工智能企业。\n\n---\n\n### **7. 体育与国际活动**\n- **奥运之城**:2008年夏季奥运会和2022年冬季奥运会的举办地,拥有鸟巢、水立方等标志性场馆。\n- **国际赛事**:承办过亚运会、世界田径锦标赛等大型国际赛事。\n\n---\n\n北京是一座将历史与现代、传统与创新完美融合的城市,既有厚重的文化积淀,又充满活力与未来感。无论是探索古迹、感受文化,还是体验现代都市生活,北京都能带来独特的魅力。' 答案部分前10个Token的Rank 1 Logprobs: Step 0: 0.0000 Step 1: -0.0000 Step 2: -0.0711 Step 3: -0.0000 Step 4: -0.1086 Step 5: -0.0150 Step 6: -0.0067 Step 7: -0.0000 Step 8: -0.0298 Step 9: -0.0091 -------------------------------------------------- ...... ...... 所有测试结果已保存到文件: ./Qwen3-30B-A3B_logprobs_K100AI_fp16.json ``` ### 精度 ```bash ## 分别在DCU和GPU上启动vllm服务,并对应运行client.py,得到各自的精度数据后,运行online文件夹下的acc.py python ./infer/online/acc.py --file1 /your_path/Qwen3-30B-A3B_logprobs_A800_fp16.json --file2 /your_path/Qwen3-30B-A3B_logprobs_K100AI_fp16.json ``` 结果 ``` 提示词:介绍一下北京.,平均绝对误差:0.002455742455325094 提示词:写一首关于春天的五言绝句.,平均绝对误差:0.0007630783482369452 提示词:请解释一下黑洞的形成原理.,平均绝对误差:0.005167613880542632 提示词:推荐三部值得一看的科幻电影,并简述理由.,平均绝对误差:0.0030238355811320616 提示词:如何有效提高编程能力?,平均绝对误差:0.014263489465471934 提示词:给我讲一个关于人工智能的笑话.,平均绝对误差:0.003418742059113811 提示词:你认为未来教育会发展成什么样?,平均绝对误差:0.0246062334959511 提示词:如何制作一道美味的麻婆豆腐?,平均绝对误差:0.005538759729023468 提示词:量子计算的原理是什么?它有哪些潜在应用?,平均绝对误差:0.012481686085721578 提示词:请用英语介绍一下中国长城.,平均绝对误差:0.001114922351905534 总体平均绝对误差:7.283410e-03 ``` DCU(K100_AI)与GPU(A800)在线推理Qwen3-30B-A3B精度一致,推理框架:vllm ### vllm在线推理Qwen3-30B-A3B-Instruct-2507 ```bash ## Qwen3-30B-A3B-Instruct-2507 至少需要双卡部署 export HIP_VISIBLE_DEVICES=6,7 ## 启动服务 vllm serve /your_path/Qwen3-30B-A3B-Instruct-2507 --tensor-parallel-size 2 --max-logprobs 10 ## 修改./infer/online/client.py, MODEL_NAME请改成/your_path/Qwen3-30B-A3B-Instruct-2507,并运行client.py, 代码内部共设置十个提示词 python client.py ``` ## result ``` 欢迎使用 Qwen3-30B-A3B 聊天客户端! 已连接到 vLLM 服务,使用模型: /home/zwq/model/Qwen3-30B-A3B-Instruct-2507 -------------------------------------------------- --- 问题 1: '介绍一下北京.' --- 完整回答 (包含思考): '北京,简称“京”,是中国的首都,也是中华人民共和国的中央人民政府所在地,是全国的政治、文化、教育和国际交往中心。它位于中国华北平原的北部,地处燕山山脉与太行山脉交汇地带,地理坐标为北纬39°54′,东经116°23′,总面积约16,410平方公里。\n\n### 历史与文化\n北京拥有超过3000年的建城史和800多年的建都史,是中国历史上多个朝代的都城。自元朝起,北京成为全国的政治中心,明清两代更是将紫禁城(今故宫)作为皇权象征,奠定了其作为国家核心的地位。北京是世界著名的历史文化名城,拥有丰富的文化遗产,包括:\n\n- **故宫**:世界上现存规模最大、保存最完整的古代宫殿建筑群,是明清两代24位皇帝的居所。\n- **天坛**:明清皇帝祭天祈谷的场所,以其精美的建筑和深厚的文化内涵闻名。\n- **颐和园**:中国现存规模最大、保存最完整的皇家园林,融合了自然景观与人工建筑。\n- **圆明园**:曾被誉为“万园之园”,虽在第二次鸦片战争中被焚毁,但遗址仍具重要历史价值。\n- **长城**:北京段的八达岭、慕田峪等是长城最著名的部分,是世界文化遗产。\n\n### 城市风貌\n北京是一座传统与现代交融的城市。城市布局以中轴线为核心,从永定门到钟鼓楼,贯穿南北,体现了中国古代“中轴对称”的城市规划理念。如今,北京不仅保留了胡同、四合院等传统民居风貌,也拥有现代化的高楼大厦、商业中心和交通系统。\n\n- **胡同与四合院**:如南锣鼓巷、什刹海地区,是体验老北京生活的重要窗口。\n- **现代地标**:国家大剧院、中央电视台总部大楼(“大裤衩”)、北京国贸大厦、鸟巢(国家体育场)和水立方(国家游泳中心)等,展现了北京的现代都市风貌。\n\n### 经济与科技\n北京是中国最重要的经济和科技创新中心之一。中关村被誉为“中国硅谷”,聚集了众多高新技术企业、科研机构和高校,是全国科技创新的重要引擎。北京的经济以服务业为主,尤其在金融、信息技术、文化创意、教育等领域具有显著优势。\n\n### 教育与科研\n北京拥有中国最顶尖的高等教育资源,包括:\n\n- 清华大学\n- 北京大学\n- 中国人民大学\n- 北京师范大学\n- 中国科学院等\n\n这些高校和科研机构为中国培养了大量人才,推动了科技与社会的发展。\n\n### 交通\n北京是中国最重要的交通枢纽之一,拥有发达的铁路、公路和航空网络。北京首都国际机场是全球最繁忙的机场之一,连接世界各地。北京地铁系统是中国最庞大的城市轨道交通网络,覆盖范围广,运营效率高。\n\n### 旅游与美食\n北京是国内外游客向往的旅游目的地。除了上述著名景点,还有:\n\n- 南海子公园、奥林匹克森林公园等城市绿地\n- 北京动物园、中国科学技术馆等文化设施\n\n北京的美食也极具特色,代表性的有:\n\n- 北京烤鸭(全聚德、便宜坊)\n- 豆汁儿配焦圈\n- 炸酱面\n- 艾窝窝、驴打滚等传统小吃\n\n### 环境与可持续发展\n近年来,北京在环境保护和可持续发展方面投入巨大,实施了“蓝天保卫战”等措施,空气质量持续改善。城市绿化率不断提高,推动绿色出行和低碳生活。\n\n---\n\n总之,北京是一座集历史厚重感与现代活力于一体的城市,既是中华文明的象征,也是中国走向世界的重要窗口。无论你是历史爱好者、文化探索者,还是科技与商业追逐者,北京都能为你提供丰富而独特的体验。' 【主要回答】: '北京,简称“京”,是中国的首都,也是中华人民共和国的中央人民政府所在地,是全国的政治、文化、教育和国际交往中心。它位于中国华北平原的北部,地处燕山山脉与太行山脉交汇地带,地理坐标为北纬39°54′,东经116°23′,总面积约16,410平方公里。\n\n### 历史与文化\n北京拥有超过3000年的建城史和800多年的建都史,是中国历史上多个朝代的都城。自元朝起,北京成为全国的政治中心,明清两代更是将紫禁城(今故宫)作为皇权象征,奠定了其作为国家核心的地位。北京是世界著名的历史文化名城,拥有丰富的文化遗产,包括:\n\n- **故宫**:世界上现存规模最大、保存最完整的古代宫殿建筑群,是明清两代24位皇帝的居所。\n- **天坛**:明清皇帝祭天祈谷的场所,以其精美的建筑和深厚的文化内涵闻名。\n- **颐和园**:中国现存规模最大、保存最完整的皇家园林,融合了自然景观与人工建筑。\n- **圆明园**:曾被誉为“万园之园”,虽在第二次鸦片战争中被焚毁,但遗址仍具重要历史价值。\n- **长城**:北京段的八达岭、慕田峪等是长城最著名的部分,是世界文化遗产。\n\n### 城市风貌\n北京是一座传统与现代交融的城市。城市布局以中轴线为核心,从永定门到钟鼓楼,贯穿南北,体现了中国古代“中轴对称”的城市规划理念。如今,北京不仅保留了胡同、四合院等传统民居风貌,也拥有现代化的高楼大厦、商业中心和交通系统。\n\n- **胡同与四合院**:如南锣鼓巷、什刹海地区,是体验老北京生活的重要窗口。\n- **现代地标**:国家大剧院、中央电视台总部大楼(“大裤衩”)、北京国贸大厦、鸟巢(国家体育场)和水立方(国家游泳中心)等,展现了北京的现代都市风貌。\n\n### 经济与科技\n北京是中国最重要的经济和科技创新中心之一。中关村被誉为“中国硅谷”,聚集了众多高新技术企业、科研机构和高校,是全国科技创新的重要引擎。北京的经济以服务业为主,尤其在金融、信息技术、文化创意、教育等领域具有显著优势。\n\n### 教育与科研\n北京拥有中国最顶尖的高等教育资源,包括:\n\n- 清华大学\n- 北京大学\n- 中国人民大学\n- 北京师范大学\n- 中国科学院等\n\n这些高校和科研机构为中国培养了大量人才,推动了科技与社会的发展。\n\n### 交通\n北京是中国最重要的交通枢纽之一,拥有发达的铁路、公路和航空网络。北京首都国际机场是全球最繁忙的机场之一,连接世界各地。北京地铁系统是中国最庞大的城市轨道交通网络,覆盖范围广,运营效率高。\n\n### 旅游与美食\n北京是国内外游客向往的旅游目的地。除了上述著名景点,还有:\n\n- 南海子公园、奥林匹克森林公园等城市绿地\n- 北京动物园、中国科学技术馆等文化设施\n\n北京的美食也极具特色,代表性的有:\n\n- 北京烤鸭(全聚德、便宜坊)\n- 豆汁儿配焦圈\n- 炸酱面\n- 艾窝窝、驴打滚等传统小吃\n\n### 环境与可持续发展\n近年来,北京在环境保护和可持续发展方面投入巨大,实施了“蓝天保卫战”等措施,空气质量持续改善。城市绿化率不断提高,推动绿色出行和低碳生活。\n\n---\n\n总之,北京是一座集历史厚重感与现代活力于一体的城市,既是中华文明的象征,也是中国走向世界的重要窗口。无论你是历史爱好者、文化探索者,还是科技与商业追逐者,北京都能为你提供丰富而独特的体验。' 答案部分前10个Token的Rank 1 Logprobs: Step 0: -0.0025 Step 1: -0.2529 Step 2: -0.1372 Step 3: -0.0000 Step 4: 0.0000 Step 5: -0.0000 Step 6: -0.0381 Step 7: -0.0007 Step 8: -0.0001 Step 9: -0.0000 -------------------------------------------------- ...... ...... 所有测试结果已保存到文件: ./Qwen3-30B-A3B-Instruct-2507_logprobs_K100AI_fp16.json ``` ### 精度 ```bash ## 分别在DCU和GPU上启动vllm服务,并对应运行client.py,得到各自的精度数据后,运行online文件夹下的acc.py python ./infer/online/acc.py --file1 /your_path/Qwen3-30B-A3B-Instruct-2507_logprobs_A800_fp16.json --file2 /your_path/Qwen3-30B-A3B-Instruct-2507_logprobs_K100AI_fp16.json ``` 结果 ``` 提示词:介绍一下北京.,平均绝对误差:0.0003844495090561395 提示词:写一首关于春天的五言绝句.,平均绝对误差:0.003621068420738993 提示词:请解释一下黑洞的形成原理.,平均绝对误差:0.013209401426135515 提示词:推荐三部值得一看的科幻电影,并简述理由.,平均绝对误差:0.028403437747607542 提示词:如何有效提高编程能力?,平均绝对误差:0.014048111713964317 提示词:给我讲一个关于人工智能的笑话.,平均绝对误差:0.027143383317161353 提示词:你认为未来教育会发展成什么样?,平均绝对误差:0.019544235430657864 提示词:如何制作一道美味的麻婆豆腐?,平均绝对误差:0.007543907890431712 提示词:量子计算的原理是什么?它有哪些潜在应用?,平均绝对误差:0.009102995577677575 提示词:请用英语介绍一下中国长城.,平均绝对误差:8.911460490779177e-05 总体平均绝对误差:1.230901e-02 ``` DCU(K100_AI)与GPU(A800)在线推理Qwen3-30B-A3B-Instruct-2507精度一致,推理框架:vllm ## 应用场景 ### 算法类别 `对话` ### 热点应用行业 `金融,教育,政府,科研,制造,能源,交通` ## 预训练权重 - [Qwen/Qwen3-30B-A3B](https://huggingface.co/Qwen/Qwen3-30B-A3B) - [Qwen/Qwen3-30B-A3B-Instruct-2507](https://huggingface.co/Qwen/Qwen3-30B-A3B-Instruct-2507) ## 源码仓库及问题反馈 - https://developer.sourcefind.cn/codes/modelzoo/qwen3-30b-a3b_vllm ## 参考资料 - https://huggingface.co/Qwen/Qwen3-30B-A3B - https://huggingface.co/Qwen/Qwen3-30B-A3B-Instruct-2507