Tiny TF Bart fixes (#8023)

8be9cb0a · Lysandre Debut · GitHub · 07747863 · 8be9cb0a
Unverified Commit 8be9cb0a authored Oct 26, 2020 by Lysandre Debut Committed by GitHub Oct 26, 2020
Show whitespace changes
Inline Side-by-side

Showing with 3 additions and 1 deletion

src/transformers/modeling_tf_bart.py src/transformers/modeling_tf_bart.py +3 -1

No files found.
--- a/src/transformers/modeling_tf_bart.py
+++ b/src/transformers/modeling_tf_bart.py
@@ -822,7 +822,7 @@ class TFBartModel(TFPretrainedBartModel):
        if decoder_attn_mask is None:
            decoder_padding_mask = make_padding_mask(decoder_input_ids, pad_token_id)
        else:
-            decoder_padding_mask = invert_mask(tf.Tensor)
+            decoder_padding_mask = invert_mask(decoder_attn_mask)

        causal_lm_mask = causal_attention_mask(tgt_len, tgt_len, mask_dtype)
        return decoder_input_ids, decoder_padding_mask, causal_lm_mask
@@ -903,6 +903,7 @@ class TFBartModel(TFPretrainedBartModel):
                output_attentions=output_attentions,
                output_hidden_states=output_hidden_states,
                return_dict=True,
+                training=training,
            )
        decoder_outputs = self.decoder(
            decoder_input_ids,
@@ -915,6 +916,7 @@ class TFBartModel(TFPretrainedBartModel):
            output_attentions=output_attentions,
            output_hidden_states=output_hidden_states,
            return_dict=return_dict,
+            training=training,
        )
        if not return_dict:
            # Attention and hidden_states will be [] or None if they aren't needed