Add support for halft in reduction op Add.

adf2e4b1 · Adam Osewski · 1c5b049d · adf2e4b1 · adf2e4b1
Commit adf2e4b1 authored Oct 19, 2023 by Adam Osewski
2 changed files
--- a/include/ck/tensor_operation/gpu/device/impl/device_grouped_gemm_multiple_d_splitk_xdl_cshuffle_tile_loop.hpp
+++ b/include/ck/tensor_operation/gpu/device/impl/device_grouped_gemm_multiple_d_splitk_xdl_cshuffle_tile_loop.hpp
@@ -130,9 +130,7 @@ __global__ void
        const auto StrideA = gemm_desc_ptr[group_id].StrideA;
        const auto StrideB = gemm_desc_ptr[group_id].StrideB;
-        auto gridwise_gemm   = GridwiseGemm();
+        auto gridwise_gemm = GridwiseGemm();
-        auto& results_buffer = gridwise_gemm.GetCThreadBuffer();
        b2c_tile_map.CalculateBottomIndex(work_scheduler.tile_id_ - offset);
        // Iterate over K dimension for this [M,N] tile

--- a/include/ck/utility/reduction_operator.hpp
+++ b/include/ck/utility/reduction_operator.hpp
@@ -52,7 +52,7 @@ struct Add
    __host__ __device__ inline constexpr void operator()(T& a, T b) const
    {
        static_assert(is_same<T, float>::value || is_same<T, double>::value ||
-                          is_same<T, int32_t>::value,
+                          is_same<T, half_t>::value || is_same<T, int32_t>::value,
                      "The data type is not supported by the Add accumulator!");
        a = a + b;