Pass seqused_k to _flash_attn_varlen_forward

898dd4bb · Tri Dao · 7ef24848 · 898dd4bb
Commit 898dd4bb authored Jul 13, 2024 by Tri Dao
Hide whitespace changes
Inline Side-by-side

Showing with 6 additions and 5 deletions

flash_attn/flash_attn_interface.py flash_attn/flash_attn_interface.py +6 -5

No files found.
--- a/flash_attn/flash_attn_interface.py
+++ b/flash_attn/flash_attn_interface.py
@@ -77,12 +77,13 @@ def _flash_attn_varlen_forward(
    dropout_p,
    softmax_scale,
    causal,
-    window_size,
-    softcap,
-    alibi_slopes,
-    return_softmax,
+    window_size=(-1, -1),
+    softcap=0.0,
+    alibi_slopes=None,
+    return_softmax=False,
    block_table=None,
    leftpad_k=None,
+    seqused_k=None,
 ):
    maybe_contiguous = lambda x: x.contiguous() if x.stride(-1) != 1 else x
    q, k, v = [maybe_contiguous(x) for x in (q, k, v)]
@@ -93,7 +94,7 @@ def _flash_attn_varlen_forward(
        None,
        cu_seqlens_q,
        cu_seqlens_k,
-        None,
+        seqused_k,
        leftpad_k,
        block_table,
        alibi_slopes,