增加mtp>1的pad

059b1961 · yangql · 19288a48 · 059b1961 · 059b1961
Commit 059b1961 authored Dec 31, 2025 by yangql
Hide whitespace changes
Inline Side-by-side

Showing with 8 additions and 0 deletions

vllm/v1/spec_decode/eagle.py vllm/v1/spec_decode/eagle.py +4 -0

vllm/zero_overhead/v1/eagle.py vllm/zero_overhead/v1/eagle.py +4 -0

No files found.
--- a/vllm/v1/spec_decode/eagle.py
+++ b/vllm/v1/spec_decode/eagle.py
@@ -282,6 +282,10 @@ class EagleProposer:
                seq_lens=seq_lens,
            )
+        #增加mtp>1的pad 
+        num_pad, num_tokens_across_dp = self.get_dp_padding(input_batch_size)
+        input_batch_size += num_pad
        for i in range(self.num_speculative_tokens - 1):
            # Update the inputs.
            # cast to int32 is crucial when eagle model is compiled.

--- a/vllm/zero_overhead/v1/eagle.py
+++ b/vllm/zero_overhead/v1/eagle.py
@@ -203,6 +203,10 @@ class V1ZeroEagleProposer(EagleProposer):
                seq_lens=seq_lens,
            )
+        #增加mtp>1的pad 
+        num_pad, num_tokens_across_dp = self.get_dp_padding(input_batch_size)
+        input_batch_size += num_pad
        for i in range(self.num_speculative_tokens - 1):
            # Update the inputs.
            # cast to int32 is crucial when eagle model is compiled.