fix learning rate display in trainer when using galore optimizer (#30085)

fix learning rate display issue in galore optimizer

fix learning rate display in trainer when using galore optimizer (#30085)
fix learning rate display issue in galore optimizer
1773afce · Anton Vlasjuk · GitHub · 08c84433 · 1773afce
Unverified Commit 1773afce authored Apr 08, 2024 by Anton Vlasjuk Committed by GitHub Apr 08, 2024
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

src/transformers/trainer_pt_utils.py src/transformers/trainer_pt_utils.py +1 -1

No files found.
--- a/src/transformers/trainer_pt_utils.py
+++ b/src/transformers/trainer_pt_utils.py
@@ -1279,7 +1279,7 @@ class LayerWiseDummyOptimizer(torch.optim.Optimizer):
    def __init__(self, optimizer_dict=None, *args, **kwargs):
        dummy_tensor = torch.randn(1, 1)
        self.optimizer_dict = optimizer_dict
-        super().__init__([dummy_tensor], {"lr": 1e-03})
+        super().__init__([dummy_tensor], {"lr": kwargs.get("lr", 1e-03)})
    def zero_grad(self, set_to_none: bool = True) -> None:
        pass