add guards

7d69eb3b · Jing Zhang · a1cd282e · 7d69eb3b · 7d69eb3b
Commit 7d69eb3b authored Aug 01, 2024 by Jing Zhang
Showing with 3 additions and 0 deletions

example/65_gemm_multiply_multiply/gemm_add_add_xdl_fp16.cpp example/65_gemm_multiply_multiply/gemm_add_add_xdl_fp16.cpp +1 -0

include/ck/utility/amd_buffer_addressing.hpp include/ck/utility/amd_buffer_addressing.hpp +2 -0

No files found.
--- a/example/65_gemm_multiply_multiply/gemm_add_add_xdl_fp16.cpp
+++ b/example/65_gemm_multiply_multiply/gemm_add_add_xdl_fp16.cpp
@@ -208,6 +208,7 @@ int main(int argc, char* argv[])
                               StrideB,
                               std::array<ck::index_t, NumDTensor>{StrideD, StrideD},
                               StrideE,
+                               1,
                               a_element_op,
                               b_element_op,
                               cde_element_op);

--- a/include/ck/utility/amd_buffer_addressing.hpp
+++ b/include/ck/utility/amd_buffer_addressing.hpp
@@ -578,6 +578,7 @@ __device__ void amd_global_atomic_add_impl(const typename vector_type<T, N>::typ
                                                      tmp.template AsType<half2_t>()[i]);
        });
    }
+#if defined(__gfx942__)
    else if constexpr(is_same<T, bhalf_t>::value)
    {
        vector_type<bhalf_t, N> tmp{src_thread_data};
@@ -586,6 +587,7 @@ __device__ void amd_global_atomic_add_impl(const typename vector_type<T, N>::typ
                                                       tmp.template AsType<bhalf2_t>()[i]);
        });
    }
+#endif
 }
 template <typename T, index_t N>