add trust_remote_code to tokenizer.from_pretrained

e9f1af36 · windows_on_wsl · bc10a390 · e9f1af36
Commit e9f1af36 authored Jun 30, 2023 by windows_on_wsl
Hide whitespace changes
Inline Side-by-side

Showing with 3 additions and 0 deletions

lm_eval/models/huggingface.py lm_eval/models/huggingface.py +3 -0

No files found.
--- a/lm_eval/models/huggingface.py
+++ b/lm_eval/models/huggingface.py
@@ -203,6 +203,7 @@ class HuggingFaceAutoLM(BaseLM):
            revision=revision,
            subfolder=subfolder,
            tokenizer=tokenizer,
+            trust_remote_code=trust_remote_code,
        )
        self.tokenizer.model_max_length = self.max_length
@@ -330,11 +331,13 @@ class HuggingFaceAutoLM(BaseLM):
        revision: str,
        subfolder: str,
        tokenizer: Optional[str] = None,
+        trust_remote_code: bool = False,
    ) -> transformers.PreTrainedTokenizer:
        """Returns a pre-trained tokenizer from a pre-trained tokenizer configuration."""
        tokenizer = self.AUTO_TOKENIZER_CLASS.from_pretrained(
            pretrained if tokenizer is None else tokenizer,
            revision=revision + ("/" + subfolder if subfolder is not None else ""),
+            trust_remote_code=trust_remote_code,
        )
        tokenizer.pad_token = tokenizer.eos_token
        return tokenizer