[V1] Allow `tokenizer_mode` and `trust_remote_code` for Detokenizer (#10211)

Signed-off-by: Roger Wang <ywang@roblox.com>

[V1] Allow `tokenizer_mode` and `trust_remote_code` for Detokenizer (#10211)
Signed-off-by: Roger Wang <ywang@roblox.com>
5fb1f935 · Roger Wang · GitHub · 36e4acd0 · 5fb1f935 · 5fb1f935
Unverified Commit 5fb1f935 authored Nov 11, 2024 by Roger Wang Committed by GitHub Nov 11, 2024
Hide whitespace changes
Inline Side-by-side

Showing with 19 additions and 5 deletions

vllm/v1/engine/llm_engine.py vllm/v1/engine/llm_engine.py +4 -1

vllm/v1/tokenizer/detokenizer.py vllm/v1/tokenizer/detokenizer.py +15 -4

No files found.
--- a/vllm/v1/engine/llm_engine.py
+++ b/vllm/v1/engine/llm_engine.py
@@ -125,7 +125,10 @@ class LLMEngine:
            # Ping the tokenizer to ensure liveness if it runs in a
            # different process.
            self.tokenizer.ping()
-        self.detokenizer = Detokenizer(self.model_config.tokenizer)
+        self.detokenizer = Detokenizer(
+            tokenizer_name=self.model_config.tokenizer,
+            tokenizer_mode=self.model_config.tokenizer_mode,
+            trust_remote_code=self.model_config.trust_remote_code)
        self.generation_config_fields = _load_generation_config_dict(
            model_config)

--- a/vllm/v1/tokenizer/detokenizer.py
+++ b/vllm/v1/tokenizer/detokenizer.py
@@ -42,13 +42,17 @@ class DetokenizerOutputs(msgspec.Struct):
 class Detokenizer:
-    def __init__(self, tokenizer_name: str):
+    def __init__(self, tokenizer_name: str, tokenizer_mode: str,
+                 trust_remote_code: bool):
        # FIXME(woosuk): Currently, the detokenizer is just a hacky prototype.
        # For example, it does not terminate properly. We need to improve this.
        self.push_port = get_open_port()
        self.pull_port = get_open_port()
-        self.detokenizer = DetokenizerProc(tokenizer_name, self.push_port,
+        self.detokenizer = DetokenizerProc(tokenizer_name=tokenizer_name,
-                                           self.pull_port)
+                                           tokenizer_mode=tokenizer_mode,
+                                           trust_remote_code=trust_remote_code,
+                                           push_port=self.push_port,
+                                           pull_port=self.pull_port)
        self.detokenizer.start()
        self.zmq_context = zmq.Context()
@@ -82,11 +86,15 @@ class DetokenizerProc(multiprocessing.Process):
    def __init__(
        self,
        tokenizer_name: str,
+        tokenizer_mode: str,
+        trust_remote_code: bool,
        pull_port: int,
        push_port: int,
    ):
        super().__init__()
        self.tokenizer_name = tokenizer_name
+        self.tokenizer_mode = tokenizer_mode
+        self.trust_remote_code = trust_remote_code
        # NOTE: The pull_port of the detokenizer should be the same as the
        # push_port of the engine. Vice versa.
        self.pull_port = pull_port
@@ -97,7 +105,10 @@ class DetokenizerProc(multiprocessing.Process):
        # not picklable.
        self.msgpack_encoder = msgpack.Encoder()
        self.msgpack_decoder = msgpack.Decoder(DetokenizerInputs)
-        self.tokenizer = get_tokenizer(self.tokenizer_name)
+        self.tokenizer = get_tokenizer(
+            tokenizer_name=self.tokenizer_name,
+            tokenizer_mode=self.tokenizer_mode,
+            trust_remote_code=self.trust_remote_code)
        # req_id -> RequestState
        self.request_states: Dict[str, RequestState] = {}