[`GPT2`] Add correct keys on `_keys_to_ignore_on_load_unexpected` on all child...

[`GPT2`] Add correct keys on `_keys_to_ignore_on_load_unexpected` on all child classes of `GPT2PreTrainedModel` (#24113) * add correct keys on `_keys_to_ignore_on_load_unexpected` * oops

[`GPT2`] Add correct keys on `_keys_to_ignore_on_load_unexpected` on all child...
[`GPT2`] Add correct keys on `_keys_to_ignore_on_load_unexpected` on all child classes of `GPT2PreTrainedModel` (#24113) * add correct keys on `_keys_to_ignore_on_load_unexpected` * oops
8b169142 · Younes Belkada · GitHub · 71a114d3 · 8b169142
Unverified Commit 8b169142 authored Jun 08, 2023 by Younes Belkada Committed by GitHub Jun 08, 2023
Hide whitespace changes
Inline Side-by-side

Showing with 5 additions and 1 deletion

src/transformers/models/gpt2/modeling_gpt2.py src/transformers/models/gpt2/modeling_gpt2.py +5 -1

No files found.
--- a/src/transformers/models/gpt2/modeling_gpt2.py
+++ b/src/transformers/models/gpt2/modeling_gpt2.py
@@ -668,7 +668,8 @@ DEPARALLELIZE_DOCSTRING = r"""
    GPT2_START_DOCSTRING,
 )
 class GPT2Model(GPT2PreTrainedModel):
-    _keys_to_ignore_on_load_missing = ["attn.masked_bias"]
+    _keys_to_ignore_on_load_unexpected = [r"h\.\d+\.attn\.bias", r"h\.\d+\.attn\.masked_bias"]
+    _keys_to_ignore_on_load_missing = [r"attn.masked_bias", r"h\.\d+\.attn\.masked_bias", r"h\.\d+\.attn\.bias"]
    def __init__(self, config):
        super().__init__(config)
@@ -1149,6 +1150,7 @@ input sequence).
    GPT2_START_DOCSTRING,
 )
 class GPT2DoubleHeadsModel(GPT2PreTrainedModel):
+    _keys_to_ignore_on_load_unexpected = [r"h\.\d+\.attn\.bias", r"h\.\d+\.attn\.masked_bias"]
    _keys_to_ignore_on_load_missing = [r"attn.masked_bias", r"attn.bias", r"lm_head.weight"]
    def __init__(self, config):
@@ -1377,6 +1379,7 @@ class GPT2DoubleHeadsModel(GPT2PreTrainedModel):
    GPT2_START_DOCSTRING,
 )
 class GPT2ForSequenceClassification(GPT2PreTrainedModel):
+    _keys_to_ignore_on_load_unexpected = [r"h\.\d+\.attn\.bias", r"h\.\d+\.attn\.masked_bias"]
    _keys_to_ignore_on_load_missing = [r"h\.\d+\.attn\.masked_bias", r"lm_head.weight"]
    def __init__(self, config):
@@ -1600,6 +1603,7 @@ class GPT2ForTokenClassification(GPT2PreTrainedModel):
    GPT2_START_DOCSTRING,
 )
 class GPT2ForQuestionAnswering(GPT2PreTrainedModel):
+    _keys_to_ignore_on_load_unexpected = [r"h\.\d+\.attn\.bias", r"h\.\d+\.attn\.masked_bias"]
    _keys_to_ignore_on_load_missing = [r"h\.\d+\.attn\.masked_bias", r"h\.\d+\.attn\.bias", r"lm_head.weight"]
    def __init__(self, config):