[Triton] Fix variable name from qkv to kv (h/t FrankZijlstra)

b8ccd200 · Tri Dao · 05481617 · b8ccd200
Commit b8ccd200 authored Nov 22, 2022 by Tri Dao
Hide whitespace changes
Inline Side-by-side

Showing with 3 additions and 3 deletions

flash_attn/flash_attn_triton.py flash_attn/flash_attn_triton.py +3 -3

No files found.
--- a/flash_attn/flash_attn_triton.py
+++ b/flash_attn/flash_attn_triton.py
@@ -212,8 +212,8 @@ def _fwd_kernel(
    lse_ptrs = Lse + off_hb * seqlen_q_rounded + offs_m
    tl.store(lse_ptrs, lse_i)
    # initialize pointers to output
-    offs_n = tl.arange(0, BLOCK_HEADDIM)
+    offs_d = tl.arange(0, BLOCK_HEADDIM)
-    out_ptrs = Out + off_b * stride_ob + off_h * stride_oh + (offs_m[:, None] * stride_om + offs_n[None, :])
+    out_ptrs = Out + off_b * stride_ob + off_h * stride_oh + (offs_m[:, None] * stride_om + offs_d[None, :])
    if EVEN_M:
        if EVEN_HEADDIM:
            tl.store(out_ptrs, acc_o)
@@ -789,7 +789,7 @@ class FlashAttnKVPackedFunc(torch.autograd.Function):
        with torch.inference_mode():
            dq = torch.empty_like(q)
            dkv = torch.empty_like(kv)
-            _flash_attn_backward(do, q, qkv[:, :, 0], qkv[:, :, 1], o, lse,
+            _flash_attn_backward(do, q, kv[:, :, 0], kv[:, :, 1], o, lse,
                                 dq, dkv[:, :, 0], dkv[:, :, 1],
                                 bias=bias, causal=ctx.causal, softmax_scale=ctx.softmax_scale)
        return dq, dkv, None, None, None