Commit 34e7967f authored by Rayyyyy's avatar Rayyyyy
Browse files

Update README

parent 67ca83cf
# GLM-4-9B # GLM-4
## 论文 ## 论文
暂无 暂无
...@@ -9,7 +9,7 @@ ...@@ -9,7 +9,7 @@
</div> </div>
## 算法原理 ## 算法原理
GLM-4-9B是智谱AI推出的最新一代预训练模型GLM-4系列中的开源版本,在语义、数学、推理、代码和知识等多方面的数据集测评中,GLM-4-9B及其人类偏好对齐的版本GLM-4-9B-Chat均表现出超越Llama-3-8B的卓越性能。以多模态模型GLM-4V-9B为例,这一模型采用了与CogVLM2相似的架构设计,能够处理高达1120 x 1120分辨率的输入,并通过降采样技术有效减少了token的开销。为了减小部署与计算开销,GLM-4V-9B没有引入额外的视觉专家模块,采用了直接混合文本和图片数据的方式进行训练,在保持文本性能的同时提升多模态能力 GLM-4系列是智谱AI推出的最新一代预训练模型的开源版本,在语义、数学、推理、代码和知识等多方面的数据集测评中,GLM-4-9B及其人类偏好对齐的版本GLM-4-9B-Chat均表现出超越Llama-3-8B的卓越性能。GLM-4-32B-0414 系列,320 亿参数,效果比肩 OpenAI 的 GPT 系列和 DeepSeek 的 V3/R1 系列,且支持非常友好的本地部署特性
<div align=center> <div align=center>
<img src="./doc/multi-mode.png" witdh=500 height=700/> <img src="./doc/multi-mode.png" witdh=500 height=700/>
</div> </div>
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment