csrc/sm90/flash_api.cpp · 41b611f7d7561790a2f5040ff89212e08c7b0011 · OpenDAS / FlashMLA

Add more GPU architctures support (#76) · 41b611f7

Zeyu WANG authored Aug 01, 2025



* Add more GPU architctures support

* Merge fmha and mla runner

* add varlen & non varlen support, and add incontiguous tensor support

* update readme

* add varlen api

---------
Co-authored-by: dianzhangc <dianzhangc@nvidia.com>

41b611f7

flash_api.cpp 9.48 KB

Replace flash_api.cpp