chore: add yaml files, related to #7

3c6d818d · Geewook Kim · 787d918b · 3c6d818d · 3c6d818d · 3c6d818d
Commit 3c6d818d authored Aug 10, 2022 by Geewook Kim
Showing with 66 additions and 0 deletions

config/train_docvqa.yaml config/train_docvqa.yaml +22 -0

config/train_rvlcdip.yaml config/train_rvlcdip.yaml +22 -0

config/train_zhtrainticket.yaml config/train_zhtrainticket.yaml +22 -0

No files found.
--- a/config/train_docvqa.yaml
+++ b/config/train_docvqa.yaml
+resume_from_checkpoint_path: null 
+result_path: "./result"
+pretrained_model_name_or_path: "naver-clova-ix/donut-base"
+dataset_name_or_paths: ["./dataset/docvqa"] # should be prepared from https://rrc.cvc.uab.es/?ch=17
+sort_json_key: True
+train_batch_sizes: [2]
+val_batch_sizes: [4]
+input_size: [2560, 1920]
+max_length: 128
+align_long_axis: False
+num_nodes: 8
+seed: 2022
+lr: 3e-5
+warmup_steps: 10000
+num_training_samples_per_epoch: 39463
+max_epochs: 300
+max_steps: null
+num_workers: 8
+val_check_interval: 1.0
+check_val_every_n_epoch: 1
+gradient_clip_val: 0.25
+verbose: True
--- a/config/train_rvlcdip.yaml
+++ b/config/train_rvlcdip.yaml
+resume_from_checkpoint_path: null 
+result_path: "./result"
+pretrained_model_name_or_path: "naver-clova-ix/donut-base"
+dataset_name_or_paths: ["./dataset/rvlcdip"] # should be prepared from https://www.cs.cmu.edu/~aharley/rvl-cdip/
+sort_json_key: True
+train_batch_sizes: [2]
+val_batch_sizes: [4]
+input_size: [2560, 1920]
+max_length: 8
+align_long_axis: False
+num_nodes: 8
+seed: 2022
+lr: 2e-5
+warmup_steps: 10000
+num_training_samples_per_epoch: 320000
+max_epochs: 100
+max_steps: null
+num_workers: 8
+val_check_interval: 1.0
+check_val_every_n_epoch: 1
+gradient_clip_val: 1.0
+verbose: True
--- a/config/train_zhtrainticket.yaml
+++ b/config/train_zhtrainticket.yaml
+resume_from_checkpoint_path: null 
+result_path: "./result"
+pretrained_model_name_or_path: "naver-clova-ix/donut-base"
+dataset_name_or_paths: ["./dataset/zhtrainticket"] # should be prepared from https://github.com/beacandler/EATEN
+sort_json_key: True
+train_batch_sizes: [8]
+val_batch_sizes: [1]
+input_size: [960, 1280]
+max_length: 256
+align_long_axis: False
+num_nodes: 1
+seed: 2022
+lr: 3e-5
+warmup_steps: 300
+num_training_samples_per_epoch: 1368
+max_epochs: 10
+max_steps: null
+num_workers: 8
+val_check_interval: 1.0
+check_val_every_n_epoch: 1
+gradient_clip_val: 1.0
+verbose: True