fix BlenderbotSmallTokenizer (#9538)

* add model_input_names * fix test

fix BlenderbotSmallTokenizer (#9538)
* add model_input_names * fix test
69ed3606 · Suraj Patil · GitHub · 2df34f4a · 69ed3606 · 69ed3606
Unverified Commit 69ed3606 authored Jan 13, 2021 by Suraj Patil Committed by GitHub Jan 13, 2021
2 changed files
--- a/src/transformers/models/blenderbot_small/tokenization_blenderbot_small.py
+++ b/src/transformers/models/blenderbot_small/tokenization_blenderbot_small.py
@@ -92,6 +92,7 @@ class BlenderbotSmallTokenizer(PreTrainedTokenizer):
        },
    }
    max_model_input_sizes = {"facebook/blenderbot_small-90M": 512}
+    model_input_names = ["attention_mask"]

    def __init__(
        self,

--- a/tests/test_modeling_blenderbot_small.py
+++ b/tests/test_modeling_blenderbot_small.py
@@ -288,8 +288,6 @@ class Blenderbot90MIntegrationTests(unittest.TestCase):

        model_inputs = self.tokenizer(src_text, return_tensors="pt").to(torch_device)

-        # model does not have "token_type_ids"
-        model_inputs.pop("token_type_ids")
        assert isinstance(self.tokenizer, BlenderbotSmallTokenizer)
        generated_ids = self.model.generate(**model_inputs)[0]
        reply = self.tokenizer.decode(generated_ids, skip_special_tokens=True, clean_up_tokenization_spaces=True)
@@ -302,8 +300,6 @@ class Blenderbot90MIntegrationTests(unittest.TestCase):
    def test_90_generation_from_short_input(self):
        model_inputs = self.tokenizer(["sam"], return_tensors="pt").to(torch_device)

-        # model does not have "token_type_ids"
-        model_inputs.pop("token_type_ids")
        generated_utterances = self.model.generate(**model_inputs)

        clean_txt = self.tokenizer.decode(