updating FP16_Optimizer example as well

17971202 · Michael Carilli · eae8b989 · 17971202
Commit 17971202 authored Aug 18, 2018 by Michael Carilli
Show whitespace changes
Inline Side-by-side

Showing with 18 additions and 4 deletions

examples/imagenet/main_fp16_optimizer.py examples/imagenet/main_fp16_optimizer.py +18 -4

No files found.
--- a/examples/imagenet/main_fp16_optimizer.py
+++ b/examples/imagenet/main_fp16_optimizer.py
@@ -204,7 +204,6 @@ def main():
    for epoch in range(args.start_epoch, args.epochs):
        if args.distributed:
            train_sampler.set_epoch(epoch)
-        adjust_learning_rate(optimizer, epoch)
        # train for one epoch
        train(train_loader, model, criterion, optimizer, epoch)
@@ -277,6 +276,8 @@ def train(train_loader, model, criterion, optimizer, epoch):
    while input is not None:
        i += 1
+        adjust_learning_rate(optimizer, epoch, i, len(train_loader))
        if args.prof:
            if i > 10:
                break
@@ -423,9 +424,22 @@ class AverageMeter(object):
        self.avg = self.sum / self.count
-def adjust_learning_rate(optimizer, epoch):
+def adjust_learning_rate(optimizer, epoch, step, len_epoch):
-    """Sets the learning rate to the initial LR decayed by 10 every 30 epochs"""
+    """LR schedule that should yield 76% converged accuracy with batch size 256"""
-    lr = args.lr * (0.1 ** (epoch // 30))
+    factor = epoch // 30
+    if epoch >= 80:
+        factor = factor + 1
+    lr = args.lr*(0.1**factor)
+   """Warmup"""
+   if epoch < 5:
+       lr = lr*float(step + epoch*len_epoch)/(5.*len_epoch)
+    if(args.local_rank == 0):
+        print("epoch = {}, step = {}, lr = {}".format(epoch, step, lr))
    for param_group in optimizer.param_groups:
        param_group['lr'] = lr