修改flashmla的接口

b909d6fc · zhuwenwen · 22a46529 · b909d6fc
Commit b909d6fc authored Aug 18, 2025 by zhuwenwen
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

vllm/attention/ops/flashmla.py vllm/attention/ops/flashmla.py +1 -1

No files found.
--- a/vllm/attention/ops/flashmla.py
+++ b/vllm/attention/ops/flashmla.py
@@ -100,7 +100,7 @@ def flash_mla_with_kvcache(
        softmax_scale = q.shape[-1]**(-0.5)
    if current_platform.is_rocm():
        if kv_cache_dtype == "fp8":         
-            out, softmax_lse = flash_mla_cuda.fwd_kvcache_quantization_mla(
+            out, softmax_lse = flash_mla_cuda.fwd_kvcache_mla(
                q,
                k_cache,
                None,