[Attention] Add ROCM_AITER_MLA_SPARSE to attention backend registry (#29103)

Signed-off-by: Matthew Bonanni <mbonanni@redhat.com>

[Attention] Add ROCM_AITER_MLA_SPARSE to attention backend registry (#29103)
Signed-off-by: Matthew Bonanni <mbonanni@redhat.com>
11857a00 · Matthew Bonanni · GitHub · 8c25f9cf · 11857a00 · 11857a00
Unverified Commit 11857a00 authored Nov 20, 2025 by Matthew Bonanni Committed by GitHub Nov 20, 2025
Show whitespace changes
Inline Side-by-side

Showing with 4 additions and 4 deletions

vllm/attention/backends/registry.py vllm/attention/backends/registry.py +3 -0

vllm/platforms/rocm.py vllm/platforms/rocm.py +1 -4

No files found.
--- a/vllm/attention/backends/registry.py
+++ b/vllm/attention/backends/registry.py
@@ -52,6 +52,9 @@ class AttentionBackendEnum(Enum, metaclass=_AttentionBackendEnumMeta):
    ROCM_AITER_FA = (
        "vllm.v1.attention.backends.rocm_aiter_fa.AiterFlashAttentionBackend"
    )
+    ROCM_AITER_MLA_SPARSE = (
+        "vllm.v1.attention.backends.mla.rocm_aiter_mla_sparse.ROCMAiterMLASparseBackend"
+    )
    TORCH_SDPA = ""  # this tag is only used for ViT
    FLASHINFER = "vllm.v1.attention.backends.flashinfer.FlashInferBackend"
    FLASHINFER_MLA = (

--- a/vllm/platforms/rocm.py
+++ b/vllm/platforms/rocm.py
@@ -233,10 +233,7 @@ class RocmPlatform(Platform):
                "Sparse MLA backend on ROCm only supports block size 1 for now."
            )
            logger.info_once("Using Sparse MLA backend on V1 engine.")
-            return (
+            return AttentionBackendEnum.ROCM_AITER_MLA_SPARSE.get_path()
-                "vllm.v1.attention.backends.mla.rocm_aiter_mla_sparse."
-                "ROCMAiterMLASparseBackend"
-            )
        if use_mla:
            if selected_backend is None: