[BugFix] Fix `--disable-log-stats` in V1 server mode (#17600)

Signed-off-by: Nick Hill <nhill@redhat.com>

[BugFix] Fix `--disable-log-stats` in V1 server mode (#17600)
Signed-off-by: Nick Hill <nhill@redhat.com>
3d13ca0e · Nick Hill · GitHub · 66ab3b13 · 3d13ca0e · 3d13ca0e
Unverified Commit 3d13ca0e authored May 07, 2025 by Nick Hill Committed by GitHub May 08, 2025
Show whitespace changes
Inline Side-by-side

Showing with 7 additions and 5 deletions

vllm/v1/engine/async_llm.py vllm/v1/engine/async_llm.py +3 -2

vllm/v1/engine/core_client.py vllm/v1/engine/core_client.py +4 -3

No files found.
--- a/vllm/v1/engine/async_llm.py
+++ b/vllm/v1/engine/async_llm.py
@@ -120,6 +120,7 @@ class AsyncLLM(EngineClient):
            executor_class=executor_class,
            log_stats=self.log_stats,
        )
+        if self.stat_loggers:
            for stat_logger in self.stat_loggers[0]:
                stat_logger.log_engine_initialized()
        self.output_handler: Optional[asyncio.Task] = None

--- a/vllm/v1/engine/core_client.py
+++ b/vllm/v1/engine/core_client.py
@@ -442,9 +442,10 @@ class MPClient(EngineCoreClient):
            logger.info("Core engine process %d ready.", eng_id)
            identities.discard(eng_id)
            # Setup KV cache config with initialization state from
-            # engine core process.
+            # engine core process. Sum values from all engines in DP case.
-            self.vllm_config.cache_config.num_gpu_blocks = message_dict[
+            num_gpu_blocks = self.vllm_config.cache_config.num_gpu_blocks or 0
-                'num_gpu_blocks']
+            num_gpu_blocks += message_dict['num_gpu_blocks']
+            self.vllm_config.cache_config.num_gpu_blocks = num_gpu_blocks
    def _init_core_engines(
        self,