Commit 30dc71b8 authored by zzg_666's avatar zzg_666
Browse files

修改模型结构

parent 202c6948
This diff is collapsed.
...@@ -11,9 +11,9 @@ Hunyuan-A13B 具备以下特点: ...@@ -11,9 +11,9 @@ Hunyuan-A13B 具备以下特点:
- 增强Agent能力: 优化Agent能力,在BFCL-v3、τ-Bench、C3-Bench等智能体基准测试中领先 - 增强Agent能力: 优化Agent能力,在BFCL-v3、τ-Bench、C3-Bench等智能体基准测试中领先
- 激活专家数: 8 - 激活专家数: 8
- 高效推理: 采用分组查询注意力(GQA)策略,支持多量化格式,实现高效推理 - 高效推理: 采用分组查询注意力(GQA)策略,支持多量化格式,实现高效推理
关键超参数如下:
<div align=center> <div align=center>
<img src="./doc/transformers.jpg"/> <img src="./doc/param.png"/>
</div> </div>
## 算法原理 ## 算法原理
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment