vllm/v1/worker/gpu_model_runner.py · ad9d09e2b8a601b50d07c76fb8736c2bbda2d6fb · OpenDAS / vllm_cscc · GitLab

Find file Blame History Permalink

[Perf] [Hybrid] Copy num_accepted_tokens in non-blocking way when not using prefix caching (#35442) · ad9d09e2
Thomas Parnell authored Mar 03, 2026
```
Signed-off-by: Thomas Parnell <tpa@zurich.ibm.com>
```
ad9d09e2

gpu_model_runner.py 269 KB