修改格式

69cac0e1 · zhouxiang · caca906d · 69cac0e1 · 69cac0e1 · 69cac0e1
Commit 69cac0e1 authored Nov 01, 2023 by zhouxiang
Showing with 3 additions and 3 deletions

README.md README.md +3 -3

doc/qwen.png doc/qwen.png +0 -0

doc/qwen推理.gif doc/qwen推理.gif +0 -0

doc/transformer.jpg doc/transformer.jpg +0 -0

qwen.jpg qwen.jpg +0 -0

No files found.
--- a/README.md
+++ b/README.md
@@ -12,7 +12,7 @@ https://arxiv.org/pdf/2308.12966.pdf

 本项目主要针对Qwen-7B-Chat在DCU平台的推理性能优化，达到DCU平台较快的对话效果。

-![qwen](qwen.jpg)
+![qwen](doc/transformer.jpg)



@@ -20,7 +20,7 @@ https://arxiv.org/pdf/2308.12966.pdf

 Qwen-7B的构建采用了类似LLaMA的架构。与标准transformer的主要差异有：1）使用非连接嵌入、2）使用旋转位置嵌入、3）在注意力中除了QKV外不使用偏置、4）使用RMSNorm代替LayerNorm、5）使用SwiGLU代替ReLU、以及6）采用快速注意力来加速训练。该模型共有32层，嵌入维度为4096，注意力头数为32。

-![qwen](qwen.png)
+![qwen](doc/qwen.png)


 ## 环境配置
@@ -104,7 +104,7 @@ chmod +x benchmark

 ## result

-![qwen推理](qwen推理.gif)
+![qwen推理](doc/qwen推理.gif)

 ### 精度


--- a/qwen.png
+++ b/qwen.png
--- a/qwen推理.gif
+++ b/qwen推理.gif
--- a/doc/transformer.jpg
+++ b/doc/transformer.jpg
--- a/qwen.jpg
+++ b/qwen.jpg