fix: mypy error (#543)

Co-authored-by: finofliu <finofliu@tencent.com>

fix: mypy error (#543)
Co-authored-by: finofliu <finofliu@tencent.com>
6eb31507 · ishandhanani · GitHub · 99cc11e6 · 6eb31507
Commit 6eb31507 authored Apr 07, 2025 by ishandhanani Committed by GitHub Apr 07, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 17 additions and 5 deletions

examples/tensorrt_llm/common/chat_processor.py examples/tensorrt_llm/common/chat_processor.py +17 -5

No files found.
--- a/examples/tensorrt_llm/common/chat_processor.py
+++ b/examples/tensorrt_llm/common/chat_processor.py
@@ -41,7 +41,8 @@ from tensorrt_llm.serve.openai_protocol import (
    ToolCall,
    UsageInfo,
 )
-from transformers import AutoTokenizer
+from transformers.tokenization_utils import PreTrainedTokenizer
+from transformers.tokenization_utils_fast import PreTrainedTokenizerFast
 logger.set_level("debug")
@@ -71,7 +72,11 @@ def parse_chat_message_content(
 class BaseChatProcessor:
-    def __init__(self, model: str, tokenizer: AutoTokenizer):
+    def __init__(
+        self,
+        model: str,
+        tokenizer: Union[PreTrainedTokenizer, PreTrainedTokenizerFast],
+    ):
        self.model = model
        self.tokenizer = tokenizer
@@ -122,7 +127,10 @@ class BaseChatProcessor:
 class ChatProcessor(BaseChatProcessor):
    def __init__(
-        self, model: str, tokenizer: AutoTokenizer, using_engine_generator: bool = False
+        self,
+        model: str,
+        tokenizer: Union[PreTrainedTokenizer, PreTrainedTokenizerFast],
+        using_engine_generator: bool = False,
    ):
        super().__init__(model, tokenizer)
        self.using_engine_generator = using_engine_generator
@@ -269,7 +277,7 @@ class ChatProcessor(BaseChatProcessor):
            if request.tools is None
            else [tool.model_dump() for tool in request.tools]
        )
-        prompt: str = self.tokenizer.apply_chat_template(
+        prompt = self.tokenizer.apply_chat_template(
            conversation=conversation,
            tokenize=False,
            add_generation_prompt=request.add_generation_prompt,
@@ -329,7 +337,11 @@ class ChatProcessor(BaseChatProcessor):
 class CompletionsProcessor:
-    def __init__(self, model: str, tokenizer: AutoTokenizer):
+    def __init__(
+        self,
+        model: str,
+        tokenizer: Union[PreTrainedTokenizer, PreTrainedTokenizerFast],
+    ):
        self.model = model
        self.tokenizer = tokenizer