added warning

60a37238 · lukovnikov · da2d8ca2 · 60a37238 · 60a37238
Commit 60a37238 authored Feb 27, 2019 by lukovnikov
Showing with 10 additions and 0 deletions

pytorch_pretrained_bert/optimization.py pytorch_pretrained_bert/optimization.py +5 -0

pytorch_pretrained_bert/optimization_openai.py pytorch_pretrained_bert/optimization_openai.py +5 -0

No files found.
--- a/pytorch_pretrained_bert/optimization.py
+++ b/pytorch_pretrained_bert/optimization.py
@@ -19,6 +19,9 @@ import torch
 from torch.optim import Optimizer
 from torch.optim.optimizer import required
 from torch.nn.utils import clip_grad_norm_
+import logging
+
+logger = logging.getLogger(__name__)

 def warmup_cosine(x, warmup=0.002):
    if x < warmup:
@@ -37,6 +40,8 @@ def warmup_linear(x, warmup=0.002):
        After `t_total`-th training step, learning rate is zero. """
    if x < warmup:
        return x/warmup
+    if x > 1:
+        logger.warning("Training beyond specified 't_total' steps. Learning rate set to zero. Please set 't_total' of BertAdam correctly.")
    return max((x-1.)/(warmup-1.), 0)

 SCHEDULES = {

--- a/pytorch_pretrained_bert/optimization_openai.py
+++ b/pytorch_pretrained_bert/optimization_openai.py
@@ -19,6 +19,9 @@ import torch
 from torch.optim import Optimizer
 from torch.optim.optimizer import required
 from torch.nn.utils import clip_grad_norm_
+import logging
+
+logger = logging.getLogger(__name__)

 def warmup_cosine(x, warmup=0.002):
    if x < warmup:
@@ -37,6 +40,8 @@ def warmup_linear(x, warmup=0.002):
        After `t_total`-th training step, learning rate is zero. """
    if x < warmup:
        return x/warmup
+    if x > 1:
+        logger.warning("Training beyond specified 't_total' steps. Learning rate set to zero. Please set 't_total' of BertAdam correctly.")
    return max((x-1.)/(warmup-1.), 0)

 SCHEDULES = {