add llama/llama_tokenizer.py

d8f03ffe · zhuwenwen · a0382aa6 · d8f03ffe
Commit d8f03ffe authored Sep 06, 2023 by zhuwenwen
Hide whitespace changes
Inline Side-by-side

Showing with 12 additions and 0 deletions

examples/cpp/llama/llama_tokenizer.py examples/cpp/llama/llama_tokenizer.py +12 -0

No files found.
--- a/examples/cpp/llama/llama_tokenizer.py
+++ b/examples/cpp/llama/llama_tokenizer.py
+import transformers
+import torch
+
+from transformers import LlamaForCausalLM, LlamaTokenizer
+
+tokenizer = LlamaTokenizer.from_pretrained('/data/models/llama-7b-hf/')
+with open('./out', 'r') as file:
+    output = file.read()
+    
+output = torch.tensor([int(id_) for id_ in output.split()])
+output = tokenizer.batch_decode(output.unsqueeze(0), skip_special_tokens=True, clean_up_tokenization_spaces=False)[0]
+print(output)
\ No newline at end of file