Commit bd2c2ab8 authored by zhaoying1's avatar zhaoying1
Browse files

Update README.md

parent 5629a613
......@@ -65,7 +65,7 @@ conda create -n baichuan2 python=3.8
pip install -r requirements.txt -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com
```
### 注意
### 注意 1
```
#到虚拟环境下对应的python/site-packages注释掉一些版本判断
......@@ -83,6 +83,10 @@ site-packages/transformers/utils/versions.py 文件
46 # )
```
### 注意 2
训练前请参考[modeling_baichuan.py](./modeling_baichuan.py)修改模型文件夹中modeling_baichuan.py的`Attention`类的代码,主要(暂时)去除去torch2.X的依赖。
## 数据集
输入数据为放置在项目[fine-tune/data](./fine-tune/data)目录下的 json 文件,`fine-tune/data/belle_chat_ramdon_10k.json`,该样例数据是从 [multiturn_chat_0.8M](https://huggingface.co/datasets/BelleGroup/multiturn_chat_0.8M) 采样出 1 万条,并且做了格式转换。主要是展示多轮数据怎么训练,不保证效果。json 文件示例格式如下:
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment