update flash_attn.py

4080ac85 · zhuwenwen · 64fc5a29 · 4080ac85
Commit 4080ac85 authored Jul 04, 2025 by zhuwenwen
Show whitespace changes
Inline Side-by-side

Showing with 6 additions and 2 deletions

vllm/v1/attention/backends/flash_attn.py vllm/v1/attention/backends/flash_attn.py +6 -2

No files found.
--- a/vllm/v1/attention/backends/flash_attn.py
+++ b/vllm/v1/attention/backends/flash_attn.py
@@ -717,7 +717,11 @@ class FlashAttentionImpl(AttentionImpl):
                    window_size=self.sliding_window,
                    block_table=block_table,
                    softcap=self.logits_soft_cap,
-                    # scheduler_metadata=scheduler_metadata,
+                    scheduler_metadata=scheduler_metadata,
+                    # fa_version=self.vllm_flash_attn_version,
+                    # q_descale=layer._q_scale.expand(descale_shape),
+                    # k_descale=layer._k_scale.expand(descale_shape),
+                    # v_descale=layer._v_scale.expand(descale_shape),
                )
            return output