set VLLM_USE_PD_SPLIT=1

69cfaa53 · zhuwenwen · e5572b2a · 69cfaa53 · 69cfaa53
Commit 69cfaa53 authored Jan 14, 2026 by zhuwenwen
Hide whitespace changes
Inline Side-by-side

Showing with 9 additions and 8 deletions

vllm/envs.py vllm/envs.py +1 -1

vllm/v1/core/sched/scheduler.py vllm/v1/core/sched/scheduler.py +8 -7

No files found.
--- a/vllm/envs.py
+++ b/vllm/envs.py
@@ -1222,7 +1222,7 @@ environment_variables: dict[str, Callable[[], Any]] = {
    # vLLM will split prefill and decode, not mix up
    "VLLM_USE_PD_SPLIT":
-        lambda: (os.environ.get("VLLM_USE_PD_SPLIT", "False").lower() in
+        lambda: (os.environ.get("VLLM_USE_PD_SPLIT", "True").lower() in
                 ("true", "1")), 
    # vLLM will sync to avoid pp vmfault

--- a/vllm/v1/core/sched/scheduler.py
+++ b/vllm/v1/core/sched/scheduler.py
@@ -1051,14 +1051,15 @@ class Scheduler(SchedulerInterface):
    def schedule(self) -> SchedulerOutput:
        if envs.VLLM_USE_PD_SPLIT: 
-            return self.schedule_split_pd()
+            if self.use_mla:
-        else:
+                if self.full_cuda_graph and self.num_spec_tokens > 0:
-            if self.connector is not None:
+                    return self.schedule_split_pd() 
-                return self.schedule_default()
+                else:
-            if self.full_cuda_graph and self.use_mla and self.num_spec_tokens > 0 :
+                    self.schedule_default()
-                return self.schedule_split_pd()
            else:
-                return self.schedule_default()
+                return self.schedule_split_pd()
+        else:
+            return self.schedule_default()
    def _update_after_schedule(
        self,