[trainer] solve "scheduler before optimizer step" warning (#11144)

* solve "scheduler before optimizer step" warning * style * correct the state evaluation test

[trainer] solve "scheduler before optimizer step" warning (#11144)
* solve "scheduler before optimizer step" warning * style * correct the state evaluation test
1ed24afe · Stas Bekman · GitHub · 02ec02d6 · 1ed24afe
Unverified Commit 1ed24afe authored Apr 08, 2021 by Stas Bekman Committed by GitHub Apr 08, 2021
Hide whitespace changes
Inline Side-by-side

Showing with 5 additions and 1 deletion

src/transformers/trainer.py src/transformers/trainer.py +5 -1

No files found.
--- a/src/transformers/trainer.py
+++ b/src/transformers/trainer.py
@@ -1151,17 +1151,21 @@ class Trainer:
                            )

                    # Optimizer step
+                    optimizer_was_run = True
                    if self.deepspeed:
                        pass  # called outside the loop
                    elif is_torch_tpu_available():
                        xm.optimizer_step(self.optimizer)
                    elif self.use_amp:
+                        scale_before = self.scaler.get_scale()
                        self.scaler.step(self.optimizer)
                        self.scaler.update()
+                        scale_after = self.scaler.get_scale()
+                        optimizer_was_run = scale_before <= scale_after
                    else:
                        self.optimizer.step()

-                    if not self.deepspeed:
+                    if optimizer_was_run and not self.deepspeed:
                        self.lr_scheduler.step()

                    model.zero_grad()