"vscode:/vscode.git/clone" did not exist on "c14ba4847e76f78a2f78bcbb55c00d408c5131b0"
Commit 190f5704 authored by Rayyyyy's avatar Rayyyyy
Browse files

Add infos in README

parent 40e0d5cd
...@@ -2,16 +2,14 @@ ...@@ -2,16 +2,14 @@
## 论文 ## 论文
## 模型结构 ## 模型结构
基于transformer结构
<div align=center> <div align=center>
<img src="./doc/transformers.jpg" witdh=300 height=400/> <img src="./doc/transformers.jpg" witdh=300 height=400/>
</div> </div>
## 算法原理 ## 算法原理
GLM-4-9B是智谱AI推出的最新一代预训练模型GLM-4系列中的开源版本,在语义、数学、推理、代码和知识等多方面的数据集测评中,GLM-4-9B及其人类偏好对齐的版本GLM-4-9B-Chat均表现出超越Llama-3-8B的卓越性能 GLM-4-9B是智谱AI推出的最新一代预训练模型GLM-4系列中的开源版本,在语义、数学、推理、代码和知识等多方面的数据集测评中,GLM-4-9B及其人类偏好对齐的版本GLM-4-9B-Chat均表现出超越Llama-3-8B的卓越性能
<div align=center>
<img src="./doc/xx.png" witdh=800 height=300/>
</div>
## 环境配置 ## 环境配置
-v 路径、docker_name和imageID根据实际情况修改 -v 路径、docker_name和imageID根据实际情况修改
...@@ -197,7 +195,11 @@ python trans_web_demo.py --model_name_or_path ../checkpoints/GLM-4-9B-Chat ...@@ -197,7 +195,11 @@ python trans_web_demo.py --model_name_or_path ../checkpoints/GLM-4-9B-Chat
</div> </div>
### 精度 ### 精度
暂无 数据集:AdvertiseGen
| device | iter | loss |
| :------: | :------: | :------: |
| A800 | 1000 | 3.0781 |
| K100 | 1000 | 3.0734 |
## 应用场景 ## 应用场景
### 算法类别 ### 算法类别
......
This diff is collapsed.
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment