vllm/v1/attention/backends/mla/flashmla_sparse.py · 3e41992fecdc31ee60715bb350f18fec18ed6680 · OpenDAS / vllm_cscc · GitLab

Find file Blame History Permalink

[Attention] Use sparse prefill kernel for fp8 kv-cache in DeepSeek-v3.2 (#27532) · 3e41992f
Lucas Wilkinson authored Dec 12, 2025
```
Signed-off-by: Lucas Wilkinson <lwilkins@redhat.com>
```
3e41992f

flashmla_sparse.py 38.7 KB