Extend Transformers Trainer Class to Enable PyTorch SGD/Adagrad Optimizers for Training (#17154)

* add torch SGD and Adagrad optimizer bits * refine naming Co-authored-by: Sylvain Gugger <35901082+sgugger@users.noreply.github.com> Co-authored-by: Sylvain Gugger <35901082+sgugger@users.noreply.github.com>

Extend Transformers Trainer Class to Enable PyTorch SGD/Adagrad Optimizers for Training (#17154)
* add torch SGD and Adagrad optimizer bits * refine naming Co-authored-by: Sylvain Gugger <35901082+sgugger@users.noreply.github.com> Co-authored-by: Sylvain Gugger <35901082+sgugger@users.noreply.github.com>
0e6ec2a4 · jianan-gu · GitHub · 63517fdf · 0e6ec2a4 · 0e6ec2a4
Unverified Commit 0e6ec2a4 authored May 11, 2022 by jianan-gu Committed by GitHub May 11, 2022
Hide whitespace changes
Inline Side-by-side

Showing with 6 additions and 0 deletions

src/transformers/trainer.py src/transformers/trainer.py +4 -0

src/transformers/training_args.py src/transformers/training_args.py +2 -0

No files found.
--- a/src/transformers/trainer.py
+++ b/src/transformers/trainer.py
@@ -978,6 +978,10 @@ class Trainer:
                optimizer_kwargs.update(adam_kwargs)
            except ImportError:
                raise ValueError("Trainer tried to instantiate bnb Adam8bit but bnb is not installed!")
+        elif args.optim == OptimizerNames.SGD:
+            optimizer_cls = torch.optim.SGD
+        elif args.optim == OptimizerNames.ADAGRAD:
+            optimizer_cls = torch.optim.Adagrad
        else:
            raise ValueError(f"Trainer cannot instantiate unsupported optimizer: {args.optim}")
        return optimizer_cls, optimizer_kwargs

--- a/src/transformers/training_args.py
+++ b/src/transformers/training_args.py
@@ -87,6 +87,8 @@ class OptimizerNames(ExplicitEnum):
    ADAMW_APEX_FUSED = "adamw_apex_fused"
    ADAFACTOR = "adafactor"
    ADAMW_BNB = "adamw_bnb_8bit"
+    SGD = "sgd"
+    ADAGRAD = "adagrad"
 @dataclass