update flash-attn interface of apply_rotary_emb

37707203 · zhuwenwen · 7d959770 · 37707203 · 37707203
Commit 37707203 authored Sep 10, 2025 by zhuwenwen
Showing with 4 additions and 0 deletions

vllm/model_executor/layers/rotary_embedding.py vllm/model_executor/layers/rotary_embedding.py +2 -0

vllm/model_executor/models/qwen2_vl.py vllm/model_executor/models/qwen2_vl.py +2 -0

No files found.
--- a/vllm/model_executor/layers/rotary_embedding.py
+++ b/vllm/model_executor/layers/rotary_embedding.py
@@ -40,6 +40,8 @@ from vllm.platforms import current_platform
 if current_platform.is_cuda():
    from vllm.vllm_flash_attn.layers.rotary import apply_rotary_emb
+if current_platform.is_rocm():
+    from flash_attn.layers.rotary import apply_rotary_emb
 def _rotate_neox(x: torch.Tensor) -> torch.Tensor:

--- a/vllm/model_executor/models/qwen2_vl.py
+++ b/vllm/model_executor/models/qwen2_vl.py
@@ -246,6 +246,8 @@ def apply_rotary_pos_emb_vision(t: torch.Tensor,
    apply_rotary_emb = apply_rotary_emb_torch
    if current_platform.is_cuda():
        from vllm.vllm_flash_attn.layers.rotary import apply_rotary_emb
+    if current_platform.is_rocm():
+        from flash_attn.layers.rotary import apply_rotary_emb
    output = apply_rotary_emb(t_, cos, sin).type_as(t)
    return output