Merge branch 'master' into 'master'

ChatGLM3-6B 微调训练 See merge request !2

Merge branch 'master' into 'master'
ChatGLM3-6B 微调训练 See merge request !2
467ec853 · lvzhen · 971c0aee · 0006ad16 · 971c0aee · 971c0aee
Commit 467ec853 authored May 10, 2024 by lvzhen
20 changed files
--- a/finetune_chatmodel_demo/preprocess_utils.py
+++ b/finetune_chatmodel_demo/preprocess_utils.py
--- a/finetune_chatmodel_demo/requirements.txt
+++ b/finetune_chatmodel_demo/requirements.txt
-transformers==4.30.2
-accelerate
-sentencepiece
-astunparse
-deepspeed
\ No newline at end of file
--- a/finetune_chatmodel_demo/scripts/finetune_ds.sh
+++ b/finetune_chatmodel_demo/scripts/finetune_ds.sh
-#! /usr/bin/env bash
-
-set -ex
-
-LR=1e-4
-NUM_GPUS=8
-MAX_SOURCE_LEN=1024
-MAX_TARGET_LEN=128
-DEV_BATCH_SIZE=4
-GRAD_ACCUMULARION_STEPS=1
-MAX_STEP=20
-SAVE_INTERVAL=500
-
-RUN_NAME=advertise_gen_ft
-BASE_MODEL_PATH=/chatglm3/chatglm3-6b
-DATASET_PATH=../formatted_data/advertise_gen.jsonl
-
-DATESTR=`date +%Y%m%d-%H%M%S`
-OUTPUT_DIR=output/${RUN_NAME}-${DATESTR}-${LR}
-MASTER_PORT=$(shuf -n 1 -i 10000-65535)
-
-mkdir -p $OUTPUT_DIR
-export HIP_VISIBLE_DEVICES=0,1,2,3,4,5,6,7
-torchrun --standalone --nnodes=1 --nproc_per_node=$NUM_GPUS ../finetune.py \
-    --train_format input-output \
-    --train_file $DATASET_PATH \
-    --preprocessing_num_workers 1 \
-    --model_name_or_path $BASE_MODEL_PATH \
-    --output_dir $OUTPUT_DIR \
-    --max_source_length $MAX_SOURCE_LEN \
-    --max_target_length $MAX_TARGET_LEN \
-    --per_device_train_batch_size $DEV_BATCH_SIZE \
-    --gradient_accumulation_steps $GRAD_ACCUMULARION_STEPS \
-    --max_steps $MAX_STEP \
-    --logging_steps 1 \
-    --save_steps $SAVE_INTERVAL \
-    --learning_rate $LR \
-    --fp16 \
-    --deepspeed ../configs/deepspeed.json 2>&1 | tee ${OUTPUT_DIR}/train.log
--- a/finetune_chatmodel_demo/scripts/finetune_ds_multiturn.sh
+++ b/finetune_chatmodel_demo/scripts/finetune_ds_multiturn.sh
--- a/finetune_chatmodel_demo/scripts/finetune_pt.sh
+++ b/finetune_chatmodel_demo/scripts/finetune_pt.sh
--- a/finetune_chatmodel_demo/scripts/finetune_pt_multiturn.sh
+++ b/finetune_chatmodel_demo/scripts/finetune_pt_multiturn.sh
--- a/finetune_chatmodel_demo/scripts/format_advertise_gen.py
+++ b/finetune_chatmodel_demo/scripts/format_advertise_gen.py
-#! /usr/bin/env python
-
-import json
-from collections import Counter
-from argparse import ArgumentParser
-import os
-
-parser = ArgumentParser()
-parser.add_argument("--path", type=str, required=True)
-
-args = parser.parse_args()
-
-with open(args.path) as f:
-    data = [json.loads(line) for line in f]
-
-train_examples = [{
-    "prompt": x['content'],
-    "response": x['summary'],
-} for x in data]
-
-os.makedirs("formatted_data", exist_ok=True)
-
-with open("formatted_data/advertise_gen.jsonl", "w") as f:
-    for e in train_examples:
-        f.write(json.dumps(e, ensure_ascii=False) + "\n")
--- a/finetune_chatmodel_demo/scripts/format_tool_alpaca.py
+++ b/finetune_chatmodel_demo/scripts/format_tool_alpaca.py
--- a/finetune_chatmodel_demo/train_data.json
+++ b/finetune_chatmodel_demo/train_data.json
--- a/finetune_chatmodel_demo/trainer.py
+++ b/finetune_chatmodel_demo/trainer.py
--- a/finetune_demo/README_en.md
+++ b/finetune_demo/README_en.md
--- a/finetune_demo/configs/ds_zero_2.json
+++ b/finetune_demo/configs/ds_zero_2.json
--- a/finetune_demo/configs/ds_zero_3.json
+++ b/finetune_demo/configs/ds_zero_3.json
--- a/finetune_demo/configs/lora.yaml
+++ b/finetune_demo/configs/lora.yaml
--- a/finetune_demo/configs/ptuning_v2.yaml
+++ b/finetune_demo/configs/ptuning_v2.yaml
--- a/finetune_demo/configs/sft.yaml
+++ b/finetune_demo/configs/sft.yaml
--- a/finetune_demo/finetune_hf.py
+++ b/finetune_demo/finetune_hf.py
--- a/finetune_demo/finetune_hf_sft.py
+++ b/finetune_demo/finetune_hf_sft.py
--- a/finetune_demo/inference_hf.py
+++ b/finetune_demo/inference_hf.py
--- a/finetune_demo/lora.sh
+++ b/finetune_demo/lora.sh
+export HIP_VISIBLE_DEVICES=7
+python finetune_hf.py  data/AdvertiseGen_fix  /path/to/chatglm3-6b  configs/lora.yaml