updating FP16_Optimizer example as well

17971202 · Michael Carilli · eae8b989 · 17971202
Commit 17971202 authored Aug 18, 2018 by Michael Carilli
Hide whitespace changes
Inline Side-by-side

Showing with 18 additions and 4 deletions

examples/imagenet/main_fp16_optimizer.py examples/imagenet/main_fp16_optimizer.py +18 -4

No files found.
--- a/examples/imagenet/main_fp16_optimizer.py
+++ b/examples/imagenet/main_fp16_optimizer.py
@@ -204,7 +204,6 @@ def main():
    for epoch in range(args.start_epoch, args.epochs):
        if args.distributed:
            train_sampler.set_epoch(epoch)
-        adjust_learning_rate(optimizer, epoch)

        # train for one epoch
        train(train_loader, model, criterion, optimizer, epoch)
@@ -277,6 +276,8 @@ def train(train_loader, model, criterion, optimizer, epoch):
    while input is not None:
        i += 1

+        adjust_learning_rate(optimizer, epoch, i, len(train_loader))
+
        if args.prof:
            if i > 10:
                break
@@ -423,9 +424,22 @@ class AverageMeter(object):
        self.avg = self.sum / self.count


-def adjust_learning_rate(optimizer, epoch):
-    """Sets the learning rate to the initial LR decayed by 10 every 30 epochs"""
-    lr = args.lr * (0.1 ** (epoch // 30))
+def adjust_learning_rate(optimizer, epoch, step, len_epoch):
+    """LR schedule that should yield 76% converged accuracy with batch size 256"""
+    factor = epoch // 30
+
+    if epoch >= 80:
+        factor = factor + 1
+
+    lr = args.lr*(0.1**factor)
+
+   """Warmup"""
+   if epoch < 5:
+       lr = lr*float(step + epoch*len_epoch)/(5.*len_epoch)
+
+    if(args.local_rank == 0):
+        print("epoch = {}, step = {}, lr = {}".format(epoch, step, lr))
+
    for param_group in optimizer.param_groups:
        param_group['lr'] = lr