Blame · csrc/flash_fwd_mla_fp16_sm90.cu · b31bfe72a83ea205467b3271a5845440a03ed7cb · OpenDAS / FlashMLA · GitLab

Switch branch/tag

flashmla

csrc

flash_fwd_mla_fp16_sm90.cu
Find file
Normal viewHistoryPermalink

flash_fwd_mla_fp16_sm90.cu

147 Bytes

Newer

Older

support fp16

Sijia Chen
committed
Feb 24, 2025

#include "flash_fwd_mla_kernel.h"

template void run_mha_fwd_splitkv_mla<cutlass::half_t, 576>(Flash_fwd_mla_params &params, cudaStream_t stream);