Merge branch 'v0.9.2-dev-lzg' into 'v0.9.2-dev'

fix bug in zero-overhead core See merge request dcutoolkit/deeplearing/vllm!192

Merge branch 'v0.9.2-dev-lzg' into 'v0.9.2-dev'
fix bug in zero-overhead core See merge request dcutoolkit/deeplearing/vllm!192
75b6adc9 · zhuwenwen · ed4b88d5 · 7d1b0c5e · 75b6adc9
Commit 75b6adc9 authored Aug 29, 2025 by zhuwenwen
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

vllm/zero_overhead/v1/core.py vllm/zero_overhead/v1/core.py +1 -1

No files found.
--- a/vllm/zero_overhead/v1/core.py
+++ b/vllm/zero_overhead/v1/core.py
@@ -177,11 +177,11 @@ def zero_overhead_update_from_output(scheduler:Scheduler,
    # loop can be a performance bottleneck. We should do our best to avoid
    # expensive operations inside the loop.
    for request in scheduler.running:
+        req_id = request.request_id
        if request.is_finished():
            if req_id in requsets_valid_token_len:
                requsets_valid_token_len.pop(req_id)
            continue
-        req_id = request.request_id
        num_tokens_scheduled = num_scheduled_tokens.get(req_id, 0)
        if num_tokens_scheduled == 0:
            # The request was not scheduled in this step.