restore original c_grid_desc_m0_n0_m1_n1_m2_n2

17774771 · danyao12 · 8582c75c · 17774771
Commit 17774771 authored Apr 28, 2023 by danyao12
Hide whitespace changes
Inline Side-by-side

Showing with 2 additions and 6 deletions

include/ck/tensor_operation/gpu/grid/gridwise_batched_multihead_attention_backward_xdl_cshuffle_pt3.hpp ...batched_multihead_attention_backward_xdl_cshuffle_pt3.hpp +2 -6

No files found.
--- a/include/ck/tensor_operation/gpu/grid/gridwise_batched_multihead_attention_backward_xdl_cshuffle_pt3.hpp
+++ b/include/ck/tensor_operation/gpu/grid/gridwise_batched_multihead_attention_backward_xdl_cshuffle_pt3.hpp
@@ -778,16 +778,12 @@ struct GridwiseBatchedMultiheadAttentionBackward_Xdl_CShuffle_V1
        __host__ __device__ static auto
        MakeCGridDesc_M0_N0_M1_N1_M2_N2_N3_N4(const CGradDesc_M_N& c_grid_desc_m_n)
        {
-            const auto M       = c_grid_desc_m_n.GetLength(I0);
-            const auto N       = c_grid_desc_m_n.GetLength(I1);
-            const auto MRepeat = M / GemmMWave / MPerXdl;
-            const auto NRepeat = N / GemmNWave / NPerXdl;
            // HACK: for unmerge transform, the length of highest dim is irrelevant so we put dummy
            // variable I1 there
            const auto c_grid_desc_m0_n0_m1_n1_m2_n2 = transform_tensor_descriptor(
                c_grid_desc_m_n,
-                make_tuple(make_unmerge_transform(make_tuple(MRepeat, GemmMWave, MPerXdl)),
+                make_tuple(make_unmerge_transform(make_tuple(I1, GemmMWave, MPerXdl)),
-                           make_unmerge_transform(make_tuple(NRepeat, GemmNWave, NPerXdl))),
+                           make_unmerge_transform(make_tuple(I1, GemmNWave, NPerXdl))),
                make_tuple(Sequence<0>{}, Sequence<1>{}),
                make_tuple(Sequence<0, 2, 4>{}, Sequence<1, 3, 5>{}));