vllm/platforms/cuda.py · b36adfa349cfab0e79f3d736d5e5413bd3ee19f5 · OpenDAS / vllm_cscc · GitLab

Find file Blame History Permalink

[Perf] Set Flashinfer sparse MLA as default backend for FP8 kv cache (#37252) · b36adfa3
Wei Zhao authored Mar 17, 2026
```
Signed-off-by: wzhao18 <wzhao18.sz@gmail.com>
```
b36adfa3

cuda.py 23.3 KB