fix: 解决原版0消耗chunk-prefill崩溃问题

2b1be0e8 · jujl1 · 9f68733a · 2b1be0e8
Commit 2b1be0e8 authored Jan 27, 2026 by jujl1
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 0 deletions

vllm/zero_overhead/v1/gpu_model_runner.py vllm/zero_overhead/v1/gpu_model_runner.py +1 -0

No files found.
--- a/vllm/zero_overhead/v1/gpu_model_runner.py
+++ b/vllm/zero_overhead/v1/gpu_model_runner.py
@@ -796,6 +796,7 @@ class V1ZeroModelRunner(GPUModelRunner):
                        req_state = self.requests[req_id]
                        token_idx = self.last_sampled_token_lens[req_idx]
                        if token_idx == -1:
+                            self.fix_sampled_token_ids[req_idx].clear()
                            continue
                        fix_len = len(self.fix_sampled_token_ids[req_idx])
                        req_state.output_token_ids[token_idx:token_idx + fix_len] = self.fix_sampled_token_ids[req_idx]