opt loading

009cce41 · carlushuang · d56b41fd · 009cce41
Commit 009cce41 authored Oct 21, 2024 by carlushuang
Show whitespace changes
Inline Side-by-side

Showing with 5 additions and 3 deletions

include/ck_tile/ops/layernorm2d/kernel/layernorm2d_fwd_kernel.hpp ...ck_tile/ops/layernorm2d/kernel/layernorm2d_fwd_kernel.hpp +5 -3

No files found.
--- a/include/ck_tile/ops/layernorm2d/kernel/layernorm2d_fwd_kernel.hpp
+++ b/include/ck_tile/ops/layernorm2d/kernel/layernorm2d_fwd_kernel.hpp
@@ -145,8 +145,10 @@ struct Layernorm2dFwd
                number<Vector_N>{},
                number<1>{});
+            // NOTE: we don't do any pad in this kernel for loading, assume that inside kernel will
+            // check the max count dynamically
            const auto tmp2_ = pad_tensor_view(
-                tmp_, make_tuple(number<Block_M>{}, number<Block_N>{}), sequence<kPadM, kPadN>{});
+                tmp_, make_tuple(number<Block_M>{}, number<Block_N>{}), sequence<false, false>{});
            return make_tile_window(
                tmp2_, make_tuple(number<Block_M>{}, number<Block_N>{}), {iM, 0});
        }();
@@ -160,7 +162,7 @@ struct Layernorm2dFwd
                number<1>{});
            const auto tmp2_ =
-                pad_tensor_view(tmp_, make_tuple(number<Block_N>{}), sequence<kPadN>{});
+                pad_tensor_view(tmp_, make_tuple(number<Block_N>{}), sequence<false>{});
            return make_tile_window(tmp2_, make_tuple(number<Block_N>{}), {0});
        }();
@@ -174,7 +176,7 @@ struct Layernorm2dFwd
                number<1>{});
            const auto tmp2_ =
-                pad_tensor_view(tmp_, make_tuple(number<Block_N>{}), sequence<kPadN>{});
+                pad_tensor_view(tmp_, make_tuple(number<Block_N>{}), sequence<false>{});
            return make_tile_window(tmp2_, make_tuple(number<Block_M>{}, number<Block_N>{}), {0});
        }();