Merge pull request #960 from ethanjperez/patch-1

Fixing unused weight_decay argument

Merge pull request #960 from ethanjperez/patch-1
Fixing unused weight_decay argument
b4f9464f · Thomas Wolf · GitHub · 822d6768 · 28ba345e · b4f9464f
Unverified Commit b4f9464f authored Aug 07, 2019 by Thomas Wolf Committed by GitHub Aug 07, 2019
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

examples/single_model_scripts/run_openai_gpt.py examples/single_model_scripts/run_openai_gpt.py +1 -1

No files found.
--- a/examples/single_model_scripts/run_openai_gpt.py
+++ b/examples/single_model_scripts/run_openai_gpt.py
@@ -205,7 +205,7 @@ def main():
        param_optimizer = list(model.named_parameters())
        no_decay = ['bias', 'LayerNorm.bias', 'LayerNorm.weight']
        optimizer_grouped_parameters = [
-            {'params': [p for n, p in param_optimizer if not any(nd in n for nd in no_decay)], 'weight_decay': 0.01},
+            {'params': [p for n, p in param_optimizer if not any(nd in n for nd in no_decay)], 'weight_decay': args.weight_decay},
            {'params': [p for n, p in param_optimizer if any(nd in n for nd in no_decay)], 'weight_decay': 0.0}
            ]
        optimizer = AdamW(optimizer_grouped_parameters, lr=args.learning_rate, eps=args.adam_epsilon)