Update README.md

e2c0b4f7 · wxj · edb026d5 · e2c0b4f7
Commit e2c0b4f7 authored Apr 17, 2025 by wxj
Hide whitespace changes
Inline Side-by-side

Showing with 20 additions and 9 deletions

README.md README.md +20 -9

No files found.
--- a/README.md
+++ b/README.md
@@ -214,15 +214,26 @@ DATA_PATH="/datasets/oscar-1GB-llama_text_document"
 将hf格式转为pt格式
 ```shell
 python tools/checkpoint/convert.py \
-  --model-type GPT \
+    --model-type GPT \
-  --loader llama_mistral \
+    --loader llama_mistral \
-  --saver megatron \
+    --saver megatron \
-  --target-tensor-parallel-size 1 \
+    --target-tensor-parallel-size 1  \
-  --checkpoint-type hf \
+    --target-pipeline-parallel-size 2 \
-  --model-size llama2-7Bf \
+    --checkpoint-type hf \
-  --load-dir /models/llama2/Llama-2-7b-hf/ \
+    --model-size llama2-7Bf \
-  --save-dir ./Llama-2-7b-megatron-lm-0108 \
+    --load-dir /data/model_weights/Llama-2-7b-hf/ \
-  --tokenizer-model /models/llama2/Llama-2-7b-hf
+    --save-dir ./tmp_modelconvert \
+    --tokenizer-model /data/model_weights/Llama-2-7b-hf/
+```
+然后在训练的脚本上添加微调的参数
+```shell
+FINETUNE_ARGS=(
+    # --finetune
+    # --pretrained-checkpoint $CHECKPOINT_PATH
+    --load $CHECKPOINT_PATH
+    --no-load-optim
+    --no-load-rng
+)
 ```
 # 参考