fix training.py

b1a6d73b · zihanl · 6fd0b406 · b1a6d73b
Commit b1a6d73b authored Nov 25, 2021 by zihanl
Show whitespace changes
Inline Side-by-side

Showing with 2 additions and 7 deletions

megatron/training.py megatron/training.py +2 -7

No files found.
--- a/megatron/training.py
+++ b/megatron/training.py
@@ -141,7 +141,6 @@ def pretrain(train_valid_test_dataset_provider,
    print_rank_0('training ...')

    iteration = 0
-    # if not args.run_dialog:
    if args.do_train and args.train_iters > 0:
        iteration = train(forward_step_func,
                          model, optimizer, lr_scheduler,
@@ -355,8 +354,6 @@ def setup_model_and_optimizer(model_provider_func, model_type):
        torch.distributed.barrier()
        timers('load-checkpoint').start()
        args.iteration = load_checkpoint(model, optimizer, lr_scheduler)
-        # need to set train_samples to None
-        args.train_samples = None
        torch.distributed.barrier()
        timers('load-checkpoint').stop()
        timers.log(['load-checkpoint'])
@@ -662,9 +659,7 @@ def train(forward_step_func, model, optimizer, lr_scheduler,
    # Iterations.
    iteration = args.iteration

-    # if not args.run_dialog:
    timers('interval-time').start()
-
    print_datetime('before the start of training step')
    report_memory_flag = True
    while iteration < args.train_iters: