# Copyright (c) Microsoft Corporation. # Licensed under the MIT license. export PYTHONPATH="$(pwd)" python3 -u retrain.py \ --train_ratio=1.0 \ --valid_ratio=1.0 \ --min_count=1 \ --is_mask=True \ --is_binary=True \ --child_lr_decay_scheme="cosine" \ --data_path="data" \ --class_num=2 \ --child_optim_algo="adam" \ --output_dir="output_sst2" \ --global_seed=1234 \ --max_input_length=64 \ --batch_size=128 \ --eval_batch_size=128 \ --num_epochs=10 \ --log_every=50 \ --eval_every_epochs=1 \ --child_num_layers=24 \ --child_out_filters=256 \ --child_l2_reg=1e-6 \ --cnn_keep_prob=0.8 \ --final_output_keep_prob=1.0 \ --embed_keep_prob=0.8 \ --lstm_out_keep_prob=0.8 \ --attention_keep_prob=0.8 \ --child_lr=0.02 \ --child_lr_max=0.002 \ --child_lr_min=5e-6 \ --child_lr_T_0=10 \ --child_lr_T_mul=2 \ --multi_path=True \ --child_fixed_arc="./arc/final_arc.json" \ --fixed_seed=True \ "$@"