Commit 190f5704 authored by Rayyyyy's avatar Rayyyyy
Browse files

Add infos in README

parent 40e0d5cd
......@@ -2,16 +2,14 @@
## 论文
## 模型结构
基于transformer结构
<div align=center>
<img src="./doc/transformers.jpg" witdh=300 height=400/>
</div>
## 算法原理
GLM-4-9B是智谱AI推出的最新一代预训练模型GLM-4系列中的开源版本,在语义、数学、推理、代码和知识等多方面的数据集测评中,GLM-4-9B及其人类偏好对齐的版本GLM-4-9B-Chat均表现出超越Llama-3-8B的卓越性能
<div align=center>
<img src="./doc/xx.png" witdh=800 height=300/>
</div>
## 环境配置
-v 路径、docker_name和imageID根据实际情况修改
......@@ -197,7 +195,11 @@ python trans_web_demo.py --model_name_or_path ../checkpoints/GLM-4-9B-Chat
</div>
### 精度
暂无
数据集:AdvertiseGen
| device | iter | loss |
| :------: | :------: | :------: |
| A800 | 1000 | 3.0781 |
| K100 | 1000 | 3.0734 |
## 应用场景
### 算法类别
......
This diff is collapsed.
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment