finetune_hunyuan.sh

# export WANDB_BASE_URL="https://api.wandb.ai"
# export WANDB_MODE=online
# export NCCL_TOPO_DUMP_FILE=/public/hy-code/FastVideo-main/scripts/finetune/topo.xml
#export AllTOAll_STREAM_WITH_COMPUTE=1
export LD_LIBRARY_PATH=/workspace/FastVideo-main/scripts/finetune/rocblas-lib:$LD_LIBRARY_PATH

HOME_PATH=/public/tengcent-hy
data_path=/public/tengcent-hy/data/Image-Vid-Finetune-HunYuan/videos2caption.json
#rm -rf $ROCM_PATH/rccl/lib/*xml
torchrun --nnodes 1 --nproc_per_node 8 \
    /public/tengcent-hy/FastVideo-main-1021/fastvideo/train.py \
    --seed 42 \
    --pretrained_model_name_or_path $HOME_PATH/model/HunyuanVideo/hunyuan-video-t2v-720p \
    --dit_model_name_or_path $HOME_PATH/model/HunyuanVideo/hunyuan-video-t2v-720p/transformers/mp_rank_00_model_states.pt\
    --model_type "hunyuan" \
    --cache_dir data/.cache \
    --data_json_path ${data_path} \
    --validation_prompt_dir $HOME_PATH/data/Image-Vid-Finetune-HunYuan/validation \
    --gradient_checkpointing \
    --train_batch_size=1 \
    --num_latent_t 32 \
    --sp_size 4 \
    --train_sp_batch_size 1 \
    --dataloader_num_workers 4 \
    --gradient_accumulation_steps=1 \
    --max_train_steps=20 \
    --learning_rate=1e-5 \
    --mixed_precision=bf16 \
    --checkpointing_steps=200 \
    --validation_steps 100 \
    --validation_sampling_steps 50 \
    --checkpoints_total_limit 3 \
    --allow_tf32 \
    --ema_start_step 0 \
    --cfg 0.0 \
    --ema_decay 0.999 \
    --log_validation \
    --output_dir=data/outputs/HSH-Taylor-Finetune-Hunyuan \
    --tracker_project_name HSH-Taylor-Finetune-Hunyuan \
    --num_frames 125 \
    --num_height 720 \
    --num_width 1280 \
    --shift 7 \
    --validation_guidance_scale "1.0" \
    # --gradient_checkpointing \