csrc/torch_bindings.cpp · 60f76243344d2d3deca5e5ecdade547acc7fed50 · OpenDAS / vllm_cscc · GitLab

Find file Blame History Permalink

Implements dual-chunk-flash-attn backend for dual chunk attention with sparse... · 60f76243
Tao He authored May 13, 2025
```
Implements dual-chunk-flash-attn backend for dual chunk attention with sparse attention support (#11844)
```
60f76243

torch_bindings.cpp 28.3 KB