Actual fix (#9787)

0f443436 · Lysandre Debut · GitHub · fac7cfb1 · 0f443436 · 0f443436
Unverified Commit 0f443436 authored Jan 25, 2021 by Lysandre Debut Committed by GitHub Jan 25, 2021
Showing with 15 additions and 0 deletions

src/transformers/models/gpt2/modeling_gpt2.py src/transformers/models/gpt2/modeling_gpt2.py +11 -0

src/transformers/models/t5/modeling_t5.py src/transformers/models/t5/modeling_t5.py +4 -0

No files found.
--- a/src/transformers/models/gpt2/modeling_gpt2.py
+++ b/src/transformers/models/gpt2/modeling_gpt2.py
@@ -541,6 +541,7 @@ class GPT2Model(GPT2PreTrainedModel):
        self.ln_f = nn.LayerNorm(config.n_embd, eps=config.layer_norm_epsilon)
        self.init_weights()
        # Model parallel
        self.model_parallel = False
        self.device_map = None
@@ -805,7 +806,9 @@ class GPT2LMHeadModel(GPT2PreTrainedModel):
        self.init_weights()
+        # Model parallel
        self.model_parallel = False
+        self.device_map = None
    @add_start_docstrings(PARALLELIZE_DOCSTRING)
    def parallelize(self, device_map=None):
@@ -971,6 +974,10 @@ class GPT2DoubleHeadsModel(GPT2PreTrainedModel):
        self.init_weights()
+        # Model parallel
+        self.model_parallel = False
+        self.device_map = None
    def get_output_embeddings(self):
        return self.lm_head
@@ -1153,6 +1160,10 @@ class GPT2ForSequenceClassification(GPT2PreTrainedModel):
        self.init_weights()
+        # Model parallel
+        self.model_parallel = False
+        self.device_map = None
    @add_start_docstrings_to_model_forward(GPT2_INPUTS_DOCSTRING)
    @add_code_sample_docstrings(
        tokenizer_class=_TOKENIZER_FOR_DOC,

--- a/src/transformers/models/t5/modeling_t5.py
+++ b/src/transformers/models/t5/modeling_t5.py
@@ -1651,6 +1651,10 @@ class T5EncoderModel(T5PreTrainedModel):
        self.init_weights()
+        # Model parallel
+        self.model_parallel = False
+        self.device_map = None
    @add_start_docstrings(PARALLELIZE_DOCSTRING)
    def parallelize(self, device_map=None):
        self.device_map = (