零消耗添加epsp

cc4d1002 · 王敏 · 855cb148 · cc4d1002
Commit cc4d1002 authored Jan 22, 2026 by 王敏
Show whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

vllm/zero_overhead/v1/gpu_model_runner.py vllm/zero_overhead/v1/gpu_model_runner.py +1 -1

No files found.
--- a/vllm/zero_overhead/v1/gpu_model_runner.py
+++ b/vllm/zero_overhead/v1/gpu_model_runner.py
@@ -465,7 +465,7 @@ class V1ZeroModelRunner(GPUModelRunner):
        num_scheduled_tokens = scheduler_output.total_num_scheduled_tokens
        # make sure that the padded length is divisible by attn_tp_size because we may need reduce-scatter across attn_tp dim.
-        if self.ep_sp:
+        if self.ep_sp or self.enable_dp_attention:
            num_input_tokens = round_up(num_scheduled_tokens, tp_size)
            if (self.use_cuda_graph
                    and num_input_tokens <= self.cudagraph_batch_sizes[-1]):