fix: remove assert

62976337 · soqeue1 · 2987beb0 · 62976337
Commit 62976337 authored Apr 04, 2022 by soqeue1
Show whitespace changes
Inline Side-by-side

Showing with 9 additions and 9 deletions

lm_eval/models/gpt2.py lm_eval/models/gpt2.py +9 -9

No files found.
--- a/lm_eval/models/gpt2.py
+++ b/lm_eval/models/gpt2.py
@@ -27,16 +27,16 @@ class HFLM(BaseLM):
        self.tokenizer = transformers.AutoTokenizer.from_pretrained(
            pretrained if tokenizer is None else tokenizer, revision=revision, subfolder=subfolder)
-        assert isinstance(self.tokenizer, (
+        # assert isinstance(self.tokenizer, (
-            transformers.GPT2Tokenizer, transformers.GPT2TokenizerFast,
+        #     transformers.GPT2Tokenizer, transformers.GPT2TokenizerFast,
-            transformers.T5Tokenizer, transformers.T5TokenizerFast,
+        #     transformers.T5Tokenizer, transformers.T5TokenizerFast,
-        )), "this tokenizer has not been checked for compatibility yet!"
+        # )), "this tokenizer has not been checked for compatibility yet!"
        self.vocab_size = self.tokenizer.vocab_size
-        if isinstance(self.tokenizer, (transformers.GPT2Tokenizer, transformers.GPT2TokenizerFast)):
+        # if isinstance(self.tokenizer, (transformers.GPT2Tokenizer, transformers.GPT2TokenizerFast)):
-            assert self.tokenizer.encode('hello\n\nhello') == [31373, 198, 198, 31373], \
+        #     assert self.tokenizer.encode('hello\n\nhello') == [31373, 198, 198, 31373], \
-                self.tokenizer.encode('hello\n\nhello')
+        #         self.tokenizer.encode('hello\n\nhello')
        # multithreading and batching
        self.batch_size_per_gpu = batch_size  # todo: adaptive batch size