[Performance] Remove unnecessary zero-fill of MLA decode output tensor in Aiter backend (#37539)

Signed-off-by: xaguilar-amd <xaguilar@amd.com>

[Performance] Remove unnecessary zero-fill of MLA decode output tensor in Aiter backend (#37539)
Signed-off-by: xaguilar-amd <xaguilar@amd.com>
f976e3b9 · xaguilar-amd · GitHub · d468322d · f976e3b9
Unverified Commit f976e3b9 authored Apr 10, 2026 by xaguilar-amd Committed by GitHub Apr 10, 2026
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

vllm/v1/attention/backends/mla/rocm_aiter_mla.py vllm/v1/attention/backends/mla/rocm_aiter_mla.py +1 -1

No files found.
--- a/vllm/v1/attention/backends/mla/rocm_aiter_mla.py
+++ b/vllm/v1/attention/backends/mla/rocm_aiter_mla.py
@@ -416,7 +416,7 @@ class AiterMLAImpl(MLACommonImpl[AiterMLAMetadata]):
        else:
            kernel_num_heads = self.num_heads
-        o = torch.zeros(
+        o = torch.empty(
            B,
            kernel_num_heads,
            self.kv_lora_rank,