fix for negative learning rate with warmup_linear in BertAdam (happens when...

fix for negative learning rate with warmup_linear in BertAdam (happens when t_total is specified incorrectly) + copied BERT optimization warmup functions to OpenAI optimization file + added comments

fix for negative learning rate with warmup_linear in BertAdam (happens when...
fix for negative learning rate with warmup_linear in BertAdam (happens when t_total is specified incorrectly) + copied BERT optimization warmup functions to OpenAI optimization file + added comments
da2d8ca2 · lukovnikov · e04bab59 · da2d8ca2 · da2d8ca2
Commit da2d8ca2 authored Feb 26, 2019 by lukovnikov
Showing with 2 additions and 2 deletions

pytorch_pretrained_bert/optimization.py pytorch_pretrained_bert/optimization.py +1 -1

pytorch_pretrained_bert/optimization_openai.py pytorch_pretrained_bert/optimization_openai.py +1 -1

No files found.
--- a/pytorch_pretrained_bert/optimization.py
+++ b/pytorch_pretrained_bert/optimization.py
@@ -37,7 +37,7 @@ def warmup_linear(x, warmup=0.002):
        After `t_total`-th training step, learning rate is zero. """
    if x < warmup:
        return x/warmup
-    return max(1.0 - x, 0)
+    return max((x-1.)/(warmup-1.), 0)
 SCHEDULES = {
    'warmup_cosine':warmup_cosine,

--- a/pytorch_pretrained_bert/optimization_openai.py
+++ b/pytorch_pretrained_bert/optimization_openai.py
@@ -37,7 +37,7 @@ def warmup_linear(x, warmup=0.002):
        After `t_total`-th training step, learning rate is zero. """
    if x < warmup:
        return x/warmup
-    return max(1.0 - x, 0)
+    return max((x-1.)/(warmup-1.), 0)
 SCHEDULES = {
    'warmup_cosine':warmup_cosine,