fixing param.grad is None in fp16 examples

2f21497d · thomwolf · da73925f · 2f21497d · 2f21497d
Commit 2f21497d authored Nov 20, 2018 by thomwolf
Hide whitespace changes
Inline Side-by-side

Showing with 4 additions and 2 deletions

examples/run_classifier.py examples/run_classifier.py +2 -1

examples/run_squad.py examples/run_squad.py +2 -1

No files found.
--- a/examples/run_classifier.py
+++ b/examples/run_classifier.py
@@ -555,7 +555,8 @@ def main():
                        if args.fp16 and args.loss_scale != 1.0:
                            # scale down gradients for fp16 training
                            for param in model.parameters():
-                                param.grad.data = param.grad.data / args.loss_scale
+                                if param.grad is not None:
+                                    param.grad.data = param.grad.data / args.loss_scale
                        is_nan = set_optimizer_params_grad(param_optimizer, model.named_parameters(), test_nan=True)
                        if is_nan:
                            logger.info("FP16 TRAINING: Nan in gradients, reducing loss scaling")

--- a/examples/run_squad.py
+++ b/examples/run_squad.py
@@ -898,7 +898,8 @@ def main():
                        if args.fp16 and args.loss_scale != 1.0:
                            # scale down gradients for fp16 training
                            for param in model.parameters():
-                                param.grad.data = param.grad.data / args.loss_scale
+                                if param.grad is not None:
+                                    param.grad.data = param.grad.data / args.loss_scale
                        is_nan = set_optimizer_params_grad(param_optimizer, model.named_parameters(), test_nan=True)
                        if is_nan:
                            logger.info("FP16 TRAINING: Nan in gradients, reducing loss scaling")