Commit c11b0fa1 authored by chenych's avatar chenych
Browse files

Update

parent 20f4e124
...@@ -3,7 +3,7 @@ modelCode=2083 ...@@ -3,7 +3,7 @@ modelCode=2083
# 模型名称 # 模型名称
modelName=GLM-5_vllm modelName=GLM-5_vllm
# 模型描述 # 模型描述
modelDescription=与 GLM-4.5 相比,GLM-5 的参数量从 355B(激活参数 32B)扩展至 744B(激活参数 40B),预训练数据量也从 23T tokens 增加到 28.5T tokens。此外,GLM-5 还集成了 DeepSeek 稀疏注意力(DSA)机制,在保持长上下文能力的同时大幅降低了部署成本。行过程 modelDescription=与 GLM-4.5 相比,GLM-5 的参数量从 355B(激活参数 32B)扩展至 744B(激活参数 40B),预训练数据量也从 23T tokens 增加到 28.5T tokens。此外,GLM-5 还集成了 DeepSeek 稀疏注意力(DSA)机制,在保持长上下文能力的同时大幅降低了部署成本。
# 运行过程 # 运行过程
processType=推理 processType=推理
# 算法类别 # 算法类别
...@@ -11,4 +11,4 @@ appCategory=对话问答 ...@@ -11,4 +11,4 @@ appCategory=对话问答
# 框架类型 # 框架类型
frameType=vllm frameType=vllm
# 加速卡类型 # 加速卡类型
accelerateType=BW1000, accelerateType=BW1000
\ No newline at end of file \ No newline at end of file
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment