[Fix] Grok-1 use tokenizer from the same pretrained path (#5532)

* [fix] use tokenizer from the same pretrained path * trust remote code

[Fix] Grok-1 use tokenizer from the same pretrained path (#5532)
* [fix] use tokenizer from the same pretrained path * trust remote code
36c4bb28 · Yuanheng Zhao · GitHub · 00525f77 · 36c4bb28 · 36c4bb28
Unverified Commit 36c4bb28 authored Mar 28, 2024 by Yuanheng Zhao Committed by GitHub Mar 28, 2024
Hide whitespace changes
Inline Side-by-side

Showing with 8 additions and 10 deletions

examples/language/grok-1/inference.py examples/language/grok-1/inference.py +4 -5

examples/language/grok-1/inference_tp.py examples/language/grok-1/inference_tp.py +4 -5

No files found.
--- a/examples/language/grok-1/inference.py
+++ b/examples/language/grok-1/inference.py
 import time

 import torch
-from transformers import AutoModelForCausalLM, LlamaTokenizerFast
+from transformers import AutoModelForCausalLM, AutoTokenizer
 from utils import get_defualt_parser, inference, print_output

 if __name__ == "__main__":
@@ -9,6 +9,9 @@ if __name__ == "__main__":
    args = parser.parse_args()
    start = time.time()
    torch.set_default_dtype(torch.bfloat16)
+
+    tokenizer = AutoTokenizer.from_pretrained(args.pretrained, trust_remote_code=True)
+
    model = AutoModelForCausalLM.from_pretrained(
        args.pretrained,
        trust_remote_code=True,
@@ -18,10 +21,6 @@ if __name__ == "__main__":
    model.eval()
    init_time = time.time() - start

-    # A transformers-compatible version of the grok-1 tokenizer by Xenova
-    # https://huggingface.co/Xenova/grok-1-tokenizer
-    tokenizer = LlamaTokenizerFast.from_pretrained("Xenova/grok-1-tokenizer")
-
    for text in args.text:
        output = inference(
            model,

--- a/examples/language/grok-1/inference_tp.py
+++ b/examples/language/grok-1/inference_tp.py
@@ -2,7 +2,7 @@ import time

 import torch
 from grok1_policy import Grok1ForCausalLMPolicy
-from transformers import AutoModelForCausalLM, LlamaTokenizerFast
+from transformers import AutoModelForCausalLM, AutoTokenizer
 from utils import get_defualt_parser, inference, print_output

 import colossalai
@@ -27,6 +27,9 @@ if __name__ == "__main__":
    )
    booster = Booster(plugin=plugin)
    torch.set_default_dtype(torch.bfloat16)
+
+    tokenizer = AutoTokenizer.from_pretrained(args.pretrained, trust_remote_code=True)
+
    with LazyInitContext(default_device=get_current_device()):
        model = AutoModelForCausalLM.from_pretrained(
            args.pretrained, trust_remote_code=True, torch_dtype=torch.bfloat16
@@ -35,10 +38,6 @@ if __name__ == "__main__":
    model.eval()
    init_time = time.time() - start

-    # A transformers-compatible version of the grok-1 tokenizer by Xenova
-    # https://huggingface.co/Xenova/grok-1-tokenizer
-    tokenizer = LlamaTokenizerFast.from_pretrained("Xenova/grok-1-tokenizer")
-
    for text in args.text:
        output = inference(
            model.unwrap(),