Merge pull request #570 from MottoX/fix-1

Create optimizer only when args.do_train is True

Merge pull request #570 from MottoX/fix-1
Create optimizer only when args.do_train is True
0198399d · Thomas Wolf · GitHub · 50fa92c0 · 74dbba64 · 0198399d
Unverified Commit 0198399d authored May 08, 2019 by Thomas Wolf Committed by GitHub May 08, 2019
5 changed files
--- a/examples/lm_finetuning/simple_lm_finetuning.py
+++ b/examples/lm_finetuning/simple_lm_finetuning.py
@@ -534,6 +534,7 @@ def main():
        model = torch.nn.DataParallel(model)
    # Prepare optimizer
+    if args.do_train:
        param_optimizer = list(model.named_parameters())
        no_decay = ['bias', 'LayerNorm.bias', 'LayerNorm.weight']
        optimizer_grouped_parameters = [

--- a/examples/run_classifier.py
+++ b/examples/run_classifier.py
@@ -763,6 +763,7 @@ def main():
        model = torch.nn.DataParallel(model)
    # Prepare optimizer
+    if args.do_train:
        param_optimizer = list(model.named_parameters())
        no_decay = ['bias', 'LayerNorm.bias', 'LayerNorm.weight']
        optimizer_grouped_parameters = [

--- a/examples/run_openai_gpt.py
+++ b/examples/run_openai_gpt.py
@@ -183,6 +183,7 @@ def main():
    eval_dataloader = DataLoader(eval_data, sampler=eval_sampler, batch_size=args.eval_batch_size)
    # Prepare optimizer
+    if args.do_train:
        param_optimizer = list(model.named_parameters())
        no_decay = ['bias', 'LayerNorm.bias', 'LayerNorm.weight']
        optimizer_grouped_parameters = [

--- a/examples/run_squad.py
+++ b/examples/run_squad.py
@@ -922,6 +922,7 @@ def main():
        model = torch.nn.DataParallel(model)
    # Prepare optimizer
+    if args.do_train:
        param_optimizer = list(model.named_parameters())
        # hack to remove pooler, which is not used

--- a/examples/run_swag.py
+++ b/examples/run_swag.py
@@ -385,6 +385,7 @@ def main():
        model = torch.nn.DataParallel(model)
    # Prepare optimizer
+    if args.do_train:
        param_optimizer = list(model.named_parameters())
        # hack to remove pooler, which is not used