fix tokenizer_info when convert the model (#661)

9febf610 · Chen Xin · GitHub · 529e56bd · 9febf610
Unverified Commit 9febf610 authored Nov 08, 2023 by Chen Xin Committed by GitHub Nov 08, 2023
Show whitespace changes
Inline Side-by-side

Showing with 5 additions and 13 deletions

lmdeploy/turbomind/deploy/source_model/llama.py lmdeploy/turbomind/deploy/source_model/llama.py +5 -13

No files found.
--- a/lmdeploy/turbomind/deploy/source_model/llama.py
+++ b/lmdeploy/turbomind/deploy/source_model/llama.py
@@ -5,7 +5,6 @@ import os.path as osp

 import torch
 from safetensors.torch import load_file
-from sentencepiece import SentencePieceProcessor

 from lmdeploy.tokenizer import Tokenizer

@@ -168,14 +167,7 @@ class LlamaModel(BaseInputModel):

    def tokenizer_info(self):
        """Read tokenizer info."""
-        assert osp.isfile(self.tokenizer_path), self.tokenizer_path
-        try:
-            tk_model = SentencePieceProcessor(model_file=self.tokenizer_path)
-            # BOS / EOS token IDs
-            n_words = tk_model.vocab_size
-            bos_id = tk_model.bos_token_id
-            eos_id = tk_model.eos_token_id
-        except Exception:
+        assert osp.isdir(self.model_path), self.model_path
        tk_model = Tokenizer(self.model_path)
        n_words = tk_model.vocab_size
        bos_id = tk_model.bos_token_id