[Log] Optimize duplicate startup log (#33944)

Signed-off-by: yewentao256 <zhyanwentao@126.com>

[Log] Optimize duplicate startup log (#33944)
Signed-off-by: yewentao256 <zhyanwentao@126.com>
67a746e8 · Wentao Ye · GitHub · 7bec4351 · 67a746e8 · 67a746e8
Unverified Commit 67a746e8 authored Feb 06, 2026 by Wentao Ye Committed by GitHub Feb 06, 2026
Showing with 10 additions and 7 deletions

vllm/compilation/backends.py vllm/compilation/backends.py +2 -1

vllm/utils/deep_gemm.py vllm/utils/deep_gemm.py +5 -3

vllm/v1/worker/gpu_worker.py vllm/v1/worker/gpu_worker.py +3 -3

No files found.
--- a/vllm/compilation/backends.py
+++ b/vllm/compilation/backends.py
@@ -263,11 +263,12 @@ class CompilerManager:
                now = time.time()
                elapsed = now - compilation_start_time
                compilation_config.compilation_time += elapsed
-                logger.info(
+                logger.info_once(
                    "Directly load the compiled graph(s) for compile range %s "
                    "from the cache, took %.3f s",
                    str(compile_range),
                    elapsed,
+                    scope="local",
                )
            return compiled_graph

--- a/vllm/utils/deep_gemm.py
+++ b/vllm/utils/deep_gemm.py
@@ -91,14 +91,16 @@ def is_deep_gemm_e8m0_used() -> bool:
    _lazy_init()
    if _fp8_gemm_nt_impl is None:
-        logger.info_once("DeepGEMM E8M0 disabled: _fp8_gemm_nt_impl not found")
+        logger.info_once(
+            "DeepGEMM E8M0 disabled: _fp8_gemm_nt_impl not found", scope="local"
+        )
        return False
    if envs.VLLM_USE_DEEP_GEMM_E8M0:
-        logger.info_once("DeepGEMM E8M0 enabled on current platform.")
+        logger.info_once("DeepGEMM E8M0 enabled on current platform.", scope="local")
        return True
-    logger.info_once("DeepGEMM E8M0 disabled on current configuration.")
+    logger.info_once("DeepGEMM E8M0 disabled on current configuration.", scope="local")
    return False

--- a/vllm/v1/worker/gpu_worker.py
+++ b/vllm/v1/worker/gpu_worker.py
@@ -119,9 +119,6 @@ class Worker(WorkerBase):
        self.use_v2_model_runner = envs.VLLM_USE_V2_MODEL_RUNNER
-        if self.use_v2_model_runner:
-            logger.info_once("Using V2 Model Runner", scope="global")
    def sleep(self, level: int = 1) -> None:
        from vllm.device_allocator.cumem import CuMemAllocator
@@ -240,6 +237,9 @@ class Worker(WorkerBase):
                current_platform.dist_backend,
            )
+            if self.use_v2_model_runner:
+                logger.info_once("Using V2 Model Runner", scope="local")
            # Set random seed.
            set_random_seed(self.model_config.seed)