Initial commit

b77a7567 · wanglch · b77a7567 · b77a7567 · b77a7567 · b77a7567
Commit b77a7567 authored Jul 03, 2024 by wanglch
20 changed files
--- a/docker/requirements.txt
+++ b/docker/requirements.txt
+transformers>=4.41.2
+datasets>=2.16.0
+accelerate>=0.30.1
+peft>=0.11.1
+trl>=0.8.6
+gradio>=4.0.0
+pandas>=2.0.0
+scipy
+einops
+sentencepiece
+tiktoken
+protobuf
+uvicorn
+pydantic
+fastapi
+sse-starlette
+matplotlib>=3.7.0
+fire
+packaging
+pyyaml
+numpy<2.0.0
+transformers_stream_generator
+modelscope
--- a/ds_zero3_work_dtk.sh
+++ b/ds_zero3_work_dtk.sh
+#!/bin/bash
+deepspeed --master_port $(shuf -n 1 -i 10000-65535)  --include="localhost:4,5,6,7" /home/wanglch/projects/LLaMA-Factory/src/train.py \
+    --deepspeed /home/wanglch/projects/LLaMA-Factory/deepspeed.json \
+    --stage sft \
+    --do_train \
+    --model_name_or_path /home/wanglch/projects/XuanYuan/XuanYuan-13B-Chat \
+    --dataset fingpt_sentiment \
+    --dataset_dir /home/wanglch/projects/LLaMA-Factory/data \
+    --template qwen \
+    --finetuning_type lora \
+    --lora_target all \
+    --output_dir /home/wanglch/projects/saves/XuanYuan-13B-Chat/lora_multi_dtk/sft \
+    --overwrite_output_dir \
+    --cutoff_len 1024 \
+    --preprocessing_num_workers 1 \
+    --per_device_train_batch_size 1 \
+    --per_device_eval_batch_size 1 \
+    --gradient_accumulation_steps 1 \
+    --lr_scheduler_type cosine \
+    --logging_steps 10 \
+    --warmup_steps 20 \
+    --save_steps 100 \
+    --eval_steps 10 \
+    --evaluation_strategy steps \
+    --load_best_model_at_end \
+    --learning_rate 5e-5 \
+    --num_train_epochs 1.0 \
+    --max_samples 3000 \
+    --val_size 0.1 \
+    --ddp_timeout 180000000 \
+    --plot_loss True \
+    --fp16
--- a/imgs/framework_1.jpg
+++ b/imgs/framework_1.jpg
--- a/imgs/framework_2.jpg
+++ b/imgs/framework_2.jpg
--- a/imgs/framework_3.jpg
+++ b/imgs/framework_3.jpg
--- a/imgs/framework_4.jpg
+++ b/imgs/framework_4.jpg
--- a/imgs/framework_5.jpg
+++ b/imgs/framework_5.jpg
--- a/imgs/framework_6.jpg
+++ b/imgs/framework_6.jpg
--- a/imgs/result.png
+++ b/imgs/result.png
--- a/imgs/result1.png
+++ b/imgs/result1.png
--- a/imgs/transformer.jpg
+++ b/imgs/transformer.jpg
--- a/imgs/transformer.png
+++ b/imgs/transformer.png
--- a/llm-code/.done
+++ b/llm-code/.done
--- a/llm-code/README.md
+++ b/llm-code/README.md
--- a/llm-code/clear_cache.sh
+++ b/llm-code/clear_cache.sh
+# 删除缓存
+rm -rf __pycache__
\ No newline at end of file
--- a/llm-code/config.py
+++ b/llm-code/config.py
--- a/llm-code/data_preprocess_run.sh
+++ b/llm-code/data_preprocess_run.sh
--- a/llm-code/dataset.py
+++ b/llm-code/dataset.py
--- a/llm-code/dxm_llm_main.py
+++ b/llm-code/dxm_llm_main.py
--- a/llm-code/model_hook.py
+++ b/llm-code/model_hook.py