[Bugfix] Remove triton do_bench fast_flush arg (#16256)

Signed-off-by: Kebe <mail@kebe7jun.com>

[Bugfix] Remove triton do_bench fast_flush arg (#16256)
Signed-off-by: Kebe <mail@kebe7jun.com>
e11880de · Kebe · GitHub · 9351f91b · e11880de
Unverified Commit e11880de authored Apr 08, 2025 by Kebe Committed by GitHub Apr 08, 2025
Show whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

tests/kernels/test_flashmla.py tests/kernels/test_flashmla.py +1 -1

No files found.
--- a/tests/kernels/test_flashmla.py
+++ b/tests/kernels/test_flashmla.py
@@ -124,7 +124,7 @@ def test_flash_mla(b, s_q, mean_sk, h_q, h_kv, d, dv, block_size, causal,
    cal_diff(out_flash, out_torch, "out")
    cal_diff(lse_flash, lse_torch, "lse")
-    t = triton.testing.do_bench(flash_mla, fast_flush=False)
+    t = triton.testing.do_bench(flash_mla)
    FLOPS = s_q * total_seqlens * h_q * (d + dv) * 2
    bytes = (total_seqlens * h_kv * d + b * s_q * h_q * d +
             b * s_q * h_q * dv) * (torch.finfo(dtype).bits // 8)