标准格式

b0177f9b · hepj987 · de4884a1 · b0177f9b · b0177f9b · b0177f9b
Commit b0177f9b authored Oct 16, 2023 by hepj987
Hide whitespace changes
Inline Side-by-side

Showing with 19 additions and 11 deletions

README.md README.md +16 -8

llama-inf.jpg llama-inf.jpg +0 -0

model.properties model.properties +3 -3

No files found.
--- a/README.md
+++ b/README.md
@@ -45,8 +45,6 @@ SwiGLU 激活函数 [PaLM]。使用 SwiGLU 激活函数替换 ReLU 非线性以

 ![llama](llama.png)

-# LLAMA推理
-
 ## 环境配置

 推荐使用docker方式运行，提供[光源](https://www.sourcefind.cn/)拉取的docker镜像：
@@ -65,13 +63,17 @@ pip install tensor_parallel==1.2.5 --no-dependencies
 pip install transformers==4.28.1 sentencepiece==0.1.99
 ```

+## 数据集
+
+无
+
 ## 模型权重下载

 [llama chat 7B](https://huggingface.co/Linly-AI/ChatFlow-7B)

 [llama caht 13b](https://huggingface.co/Linly-AI/ChatFlow-13B)

-## 模型推理
+## 推理

 ### 单卡推理

@@ -121,6 +123,16 @@ SPM_PATH	为下载的llama 模型tokenizer路径
 #其他参数与单卡推理相同
 ```

+## result
+
+`多轮对话`
+
+![image-llama](llama-inf.jpg)
+
+## 精度
+
+无
+
 ## 应用场景

 ### 算法类别
@@ -131,14 +143,10 @@ SPM_PATH	为下载的llama 模型tokenizer路径

 `nlp,智能聊天助手`

-## 多轮对话推理效果
-
-![image-llama](./doc/llama-inf.jpg)
-
 ## 源码仓库及问题反馈

 https://developer.hpccube.com/codes/hepj/llama_pytorch

-## 参考
+## 参考资料

 https://github.com/ProjectD-AI/llama_inference
\ No newline at end of file
--- a/llama-inf.jpg
+++ b/llama-inf.jpg
--- a/model.properties
+++ b/model.properties
 # 模型唯一标识
 modelCode=405
 # 模型名称
-modelName=LLaMA_inference_pytorch
+modelName=llaMA_inference_pytorch
 # 模型描述
 modelDescription=基于tencentpretrain框架的llama模型推理
 # 应用场景
-appScenario=推理,inference,nlp,智能聊天助手
+appScenario=推理,nlp,智能聊天助手
 # 框架类型
-frameType=Pytorch,Transformers,Deepspeed
+frameType=pytorch,transformers,deepspeed