Update README.md

bd2c2ab8 · zhaoying1 · 5629a613 · bd2c2ab8
Commit bd2c2ab8 authored Nov 23, 2023 by zhaoying1
Hide whitespace changes
Inline Side-by-side

Showing with 5 additions and 1 deletion

README.md README.md +5 -1

No files found.
--- a/README.md
+++ b/README.md
@@ -65,7 +65,7 @@ conda create -n baichuan2 python=3.8
 pip install -r requirements.txt -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com
 ```

-### 注意
+### 注意 1

 ```
 #到虚拟环境下对应的python/site-packages注释掉一些版本判断
@@ -83,6 +83,10 @@ site-packages/transformers/utils/versions.py 文件
 46     #    )
 ```

+### 注意 2
+
+训练前请参考[modeling_baichuan.py](./modeling_baichuan.py)修改模型文件夹中modeling_baichuan.py的`Attention`类的代码，主要(暂时)去除去torch2.X的依赖。
+
 ## 数据集

 输入数据为放置在项目[fine-tune/data](./fine-tune/data)目录下的 json 文件，`fine-tune/data/belle_chat_ramdon_10k.json`，该样例数据是从 [multiturn_chat_0.8M](https://huggingface.co/datasets/BelleGroup/multiturn_chat_0.8M) 采样出 1 万条，并且做了格式转换。主要是展示多轮数据怎么训练，不保证效果。json 文件示例格式如下：