Merge branch 'develop' into bnorm_bwd_pr

d0b49a14 · Qianfeng Zhang · 29026b0e · 87fd1152 · d0b49a14 · d0b49a14
Commit d0b49a14 authored Oct 28, 2022 by Qianfeng Zhang
Showing with 91 additions and 28 deletions

test/normalization/test_layernorm2d_util.hpp test/normalization/test_layernorm2d_util.hpp +21 -21

test/space_filling_curve/space_filling_curve.cpp test/space_filling_curve/space_filling_curve.cpp +70 -7

No files found.
--- a/test/layernorm/test_layernorm2d_util.hpp
+++ b/test/layernorm/test_layernorm2d_util.hpp
@@ -9,7 +9,7 @@

 #include "ck/ck.hpp"
 #include "ck/utility/number.hpp"
-#include "ck/tensor_operation/gpu/device/device_layernorm_impl.hpp"
+#include "ck/tensor_operation/gpu/device/impl/device_normalization_impl.hpp"

 #include "ck/library/utility/check_err.hpp"
 #include "ck/library/utility/host_tensor.hpp"
@@ -65,26 +65,26 @@ class TestLayernorm2d : public ::testing::Test
                                                                         Rank,
                                                                         NumReduceDim>;

-    using DeviceInstance = tensor_operation::device::DeviceLayernormImpl<XDataType,
-                                                                         GammaDataType,
-                                                                         BetaDataType,
-                                                                         AccDataType,
-                                                                         YDataType,
-                                                                         PassThrough,
-                                                                         Rank,
-                                                                         NumReduceDim,
-                                                                         BlockSize,
-                                                                         MThreadClusterSize,
-                                                                         KThreadClusterSize,
-                                                                         MThreadSliceSize,
-                                                                         KThreadSliceSize,
-                                                                         XYSrcVectorDim,
-                                                                         XSrcVectorSize,
-                                                                         GammaSrcVectorDim,
-                                                                         GammaSrcVectorSize,
-                                                                         BetaSrcVectorDim,
-                                                                         BetaSrcVectorSize,
-                                                                         YDstVectorSize>;
+    using DeviceInstance = tensor_operation::device::DeviceNormalizationImpl<XDataType,
+                                                                             GammaDataType,
+                                                                             BetaDataType,
+                                                                             AccDataType,
+                                                                             YDataType,
+                                                                             PassThrough,
+                                                                             Rank,
+                                                                             NumReduceDim,
+                                                                             BlockSize,
+                                                                             MThreadClusterSize,
+                                                                             KThreadClusterSize,
+                                                                             MThreadSliceSize,
+                                                                             KThreadSliceSize,
+                                                                             XYSrcVectorDim,
+                                                                             XSrcVectorSize,
+                                                                             GammaSrcVectorDim,
+                                                                             GammaSrcVectorSize,
+                                                                             BetaSrcVectorDim,
+                                                                             BetaSrcVectorSize,
+                                                                             YDstVectorSize>;

    TestLayernorm2d() : ref_instance_invoker_(ReferenceInstance{}.MakeInvoker()) {}


--- a/test/space_filling_curve/space_filling_curve.cpp
+++ b/test/space_filling_curve/space_filling_curve.cpp
@@ -12,28 +12,91 @@

 using namespace ck;

-void traverse_using_space_filling_curve();
+void traverse_using_space_filling_curve_linear();
+void traverse_using_space_filling_curve_snakecurved();

 int main(int argc, char** argv)
 {
    (void)argc;
    (void)argv;

-    traverse_using_space_filling_curve();
+    traverse_using_space_filling_curve_linear();
+    traverse_using_space_filling_curve_snakecurved();

    return 0;
 }

-void traverse_using_space_filling_curve()
+void traverse_using_space_filling_curve_linear()
 {
    constexpr auto I0 = Number<0>{};
    constexpr auto I1 = Number<1>{};
    constexpr auto I2 = Number<2>{};

-    using TensorLengths     = Sequence<16, 10, 9>;
-    using DimAccessOrder    = Sequence<2, 0, 1>;
-    using ScalarsPerAccess  = Sequence<4, 2, 3>;
-    using SpaceFillingCurve = SpaceFillingCurve<TensorLengths, DimAccessOrder, ScalarsPerAccess>;
+    using TensorLengths    = Sequence<3, 2, 2>;
+    using DimAccessOrder   = Sequence<2, 0, 1>;
+    using ScalarsPerAccess = Sequence<1, 1, 1>;
+    using SpaceFillingCurve =
+        SpaceFillingCurve<TensorLengths, DimAccessOrder, ScalarsPerAccess, false>;
+
+    constexpr auto expected = make_tuple(make_tuple(0, 0, 0),
+                                         make_tuple(0, 1, 0),
+                                         make_tuple(1, 0, 0),
+                                         make_tuple(1, 1, 0),
+                                         make_tuple(2, 0, 0),
+                                         make_tuple(2, 1, 0),
+                                         make_tuple(0, 0, 1),
+                                         make_tuple(0, 1, 1),
+                                         make_tuple(1, 0, 1),
+                                         make_tuple(1, 1, 1),
+                                         make_tuple(2, 0, 1),
+                                         make_tuple(2, 1, 1));
+
+    constexpr index_t num_access = SpaceFillingCurve::GetNumOfAccess();
+
+    static_assert(num_access == reduce_on_sequence(TensorLengths{} / ScalarsPerAccess{},
+                                                   math::multiplies{},
+                                                   Number<1>{}));
+
+    static_for<1, num_access, 1>{}([&](auto i) {
+        constexpr auto idx_curr = SpaceFillingCurve::GetIndex(i);
+
+        static_assert(idx_curr[I0] == expected[i][I0]);
+        static_assert(idx_curr[I1] == expected[i][I1]);
+        static_assert(idx_curr[I2] == expected[i][I2]);
+
+        constexpr auto backward_step = SpaceFillingCurve::GetBackwardStep(i);
+        constexpr auto expected_step = expected[i - I1] - expected[i];
+        static_assert(backward_step[I0] == expected_step[I0]);
+        static_assert(backward_step[I1] == expected_step[I1]);
+        static_assert(backward_step[I2] == expected_step[I2]);
+    });
+
+    static_for<0, num_access - 1, 1>{}([&](auto i) {
+        constexpr auto idx_curr = SpaceFillingCurve::GetIndex(i);
+
+        static_assert(idx_curr[I0] == expected[i][I0]);
+        static_assert(idx_curr[I1] == expected[i][I1]);
+        static_assert(idx_curr[I2] == expected[i][I2]);
+
+        constexpr auto forward_step  = SpaceFillingCurve::GetForwardStep(i);
+        constexpr auto expected_step = expected[i + I1] - expected[i];
+        static_assert(forward_step[I0] == expected_step[I0]);
+        static_assert(forward_step[I1] == expected_step[I1]);
+        static_assert(forward_step[I2] == expected_step[I2]);
+    });
+}
+
+void traverse_using_space_filling_curve_snakecurved()
+{
+    constexpr auto I0 = Number<0>{};
+    constexpr auto I1 = Number<1>{};
+    constexpr auto I2 = Number<2>{};
+
+    using TensorLengths    = Sequence<16, 10, 9>;
+    using DimAccessOrder   = Sequence<2, 0, 1>;
+    using ScalarsPerAccess = Sequence<4, 2, 3>;
+    using SpaceFillingCurve =
+        SpaceFillingCurve<TensorLengths, DimAccessOrder, ScalarsPerAccess, true>;

    constexpr auto expected = make_tuple(make_tuple(0, 0, 0),
                                         make_tuple(0, 2, 0),