fix: remove assert

62976337 · soqeue1 · 2987beb0 · 62976337
Commit 62976337 authored Apr 04, 2022 by soqeue1
Hide whitespace changes
Inline Side-by-side

Showing with 9 additions and 9 deletions

lm_eval/models/gpt2.py lm_eval/models/gpt2.py +9 -9

No files found.
--- a/lm_eval/models/gpt2.py
+++ b/lm_eval/models/gpt2.py
@@ -27,16 +27,16 @@ class HFLM(BaseLM):
        self.tokenizer = transformers.AutoTokenizer.from_pretrained(
            pretrained if tokenizer is None else tokenizer, revision=revision, subfolder=subfolder)

-        assert isinstance(self.tokenizer, (
-            transformers.GPT2Tokenizer, transformers.GPT2TokenizerFast,
-            transformers.T5Tokenizer, transformers.T5TokenizerFast,
-        )), "this tokenizer has not been checked for compatibility yet!"
+        # assert isinstance(self.tokenizer, (
+        #     transformers.GPT2Tokenizer, transformers.GPT2TokenizerFast,
+        #     transformers.T5Tokenizer, transformers.T5TokenizerFast,
+        # )), "this tokenizer has not been checked for compatibility yet!"

        self.vocab_size = self.tokenizer.vocab_size

-        if isinstance(self.tokenizer, (transformers.GPT2Tokenizer, transformers.GPT2TokenizerFast)):
-            assert self.tokenizer.encode('hello\n\nhello') == [31373, 198, 198, 31373], \
-                self.tokenizer.encode('hello\n\nhello')
+        # if isinstance(self.tokenizer, (transformers.GPT2Tokenizer, transformers.GPT2TokenizerFast)):
+        #     assert self.tokenizer.encode('hello\n\nhello') == [31373, 198, 198, 31373], \
+        #         self.tokenizer.encode('hello\n\nhello')

        # multithreading and batching
        self.batch_size_per_gpu = batch_size  # todo: adaptive batch size
@@ -75,7 +75,7 @@ class HFLM(BaseLM):

    def tok_encode(self, string: str):
        return self.tokenizer.encode(string, add_special_tokens=False)
-    
+
    def tok_decode(self, tokens):
        return self.tokenizer.decode(tokens)

@@ -89,7 +89,7 @@ class HFLM(BaseLM):
        """
        with torch.no_grad():
            return self.gpt2(inps)[0][:, :, :50257]
-    
+
    def _model_generate(self, context, max_length, eos_token_id):
        return self.gpt2.generate(
            context,