Update README_cn.md

cc73f88a · ShuoZhang2003 · GitHub · 7ede4dd6 · cc73f88a
Unverified Commit cc73f88a authored Dec 16, 2023 by ShuoZhang2003 Committed by GitHub Dec 16, 2023
Hide whitespace changes
Inline Side-by-side

Showing with 4 additions and 1 deletion

README_cn.md README_cn.md +4 -1

No files found.
--- a/README_cn.md
+++ b/README_cn.md
@@ -144,7 +144,10 @@ bash eval/eval.sh 'EVAL_PTH' 'SAVE_NAME'
 **注意：** 需要指定训练数据的路径，该路径应该是包含对话列表的 json 文件。
-受 Qwen-VL 的启发，我们冻结了大型语言模型（LLM），并将 LoRA 引入四个线性层```"c_attn"、"attn.c_proj"、"w1"、"w2"```进行训练。 这使得使用 8 个 NVIDIA 3090 GPU 训练 Monkey 成为可能。 具体实现代码在```model_qwen_new.py```中。 使用时只需将```model_qwen.py```的内容替换为```model_qwen_new.py```的内容即可。
+受 Qwen-VL 的启发，我们冻结了大型语言模型（LLM），并将 LoRA 引入四个线性层```"c_attn"、"attn.c_proj"、"w1"、"w2"```进行训练。 这使得使用 8 个 NVIDIA 3090 GPU 训练 Monkey 成为可能。
+ - 添加LoRA：需要将```model_qwen.py```的内容替换为```model_qwen_new.py```的内容
+ - 冻结LLM：需要在```finetune_multitask.py```中冻结除LoRA和Resampler模块的其他模块
 ## 性能