Filter tokenizer warning for kimi models (#12485)

69193f71 · Ke Bao · GitHub · d5b6e50f · 69193f71
Unverified Commit 69193f71 authored Nov 01, 2025 by Ke Bao Committed by GitHub Nov 01, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 11 additions and 0 deletions

python/sglang/srt/utils/hf_transformers_utils.py python/sglang/srt/utils/hf_transformers_utils.py +11 -0

No files found.
--- a/python/sglang/srt/utils/hf_transformers_utils.py
+++ b/python/sglang/srt/utils/hf_transformers_utils.py
@@ -15,6 +15,7 @@

 import contextlib
 import json
+import logging
 import os
 import tempfile
 import warnings
@@ -348,6 +349,12 @@ def get_context_length(config):
 _FAST_LLAMA_TOKENIZER = "hf-internal-testing/llama-tokenizer"


+# Filter warnings like: https://github.com/sgl-project/sglang/issues/8082
+class TokenizerWarningsFilter(logging.Filter):
+    def filter(self, record: logging.LogRecord) -> bool:
+        return "Calling super().encode with" not in record.getMessage()
+
+
 def get_tokenizer(
    tokenizer_name: str,
    *args,
@@ -393,6 +400,10 @@ def get_tokenizer(
            clean_up_tokenization_spaces=False,
            **kwargs,
        )
+        # Filter tokenizer warnings
+        logging.getLogger(tokenizer.__class__.__module__).addFilter(
+            TokenizerWarningsFilter()
+        )
    except TypeError as e:
        # The LLaMA tokenizer causes a protobuf error in some environments.
        err_msg = (