[CI][AMD] spec_decode:eagle skip FLASH_ATTN for deepseek on ROCm (#29827)

Signed-off-by: Divakar Verma <divakar.verma@amd.com>

[CI][AMD] spec_decode:eagle skip FLASH_ATTN for deepseek on ROCm (#29827)
Signed-off-by: Divakar Verma <divakar.verma@amd.com>
e2fbfc95 · Divakar Verma · GitHub · a690fb5b · e2fbfc95
Unverified Commit e2fbfc95 authored Dec 01, 2025 by Divakar Verma Committed by GitHub Dec 02, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 4 additions and 1 deletion

tests/v1/e2e/test_spec_decode.py tests/v1/e2e/test_spec_decode.py +4 -1

No files found.
--- a/tests/v1/e2e/test_spec_decode.py
+++ b/tests/v1/e2e/test_spec_decode.py
@@ -414,7 +414,10 @@ def test_eagle_correctness(
            )
        if attn_backend == "FLASH_ATTN" and current_platform.is_rocm():
-            m.setenv("VLLM_ROCM_USE_AITER", "1")
+            if "deepseek" in model_setup[1].lower():
+                pytest.skip("FLASH_ATTN for deepseek not supported on ROCm platform")
+            else:
+                m.setenv("VLLM_ROCM_USE_AITER", "1")
        method, model_name, spec_model_name, tp_size = model_setup
        max_model_len = 2048