add guards

0fff2a66 · Jing Zhang · 35e61bf6 · 0fff2a66
Commit 0fff2a66 authored Jul 31, 2024 by Jing Zhang
Hide whitespace changes
Inline Side-by-side

Showing with 4 additions and 3 deletions

include/ck/utility/amd_buffer_addressing.hpp include/ck/utility/amd_buffer_addressing.hpp +4 -3

No files found.
--- a/include/ck/utility/amd_buffer_addressing.hpp
+++ b/include/ck/utility/amd_buffer_addressing.hpp
@@ -566,9 +566,12 @@ template <typename T, index_t N>
 __device__ void amd_global_atomic_add_impl(const typename vector_type<T, N>::type src_thread_data,
                                           T* addr)
 {
+    static_assert((is_same<T, bhalf_t>::value && (N == 2 || N == 4 || N == 8)) ||
+                      (is_same<T, half_t>::value && (N == 2 || N == 4 || N == 8)),
+                  "wrong! not implemented");
+
    if constexpr(is_same<T, half_t>::value)
    {
-        static_assert(N % 2 == 0, "");
        vector_type<half_t, N> tmp{src_thread_data};
        static_for<0, N / 2, 1>{}([&](auto i) {
            __builtin_amdgcn_global_atomic_fadd_v2f16(bit_cast<half2_t*>(addr) + i,
@@ -577,7 +580,6 @@ __device__ void amd_global_atomic_add_impl(const typename vector_type<T, N>::typ
    }
    else if constexpr(is_same<T, bhalf_t>::value)
    {
-        static_assert(N % 2 == 0, "");
        vector_type<bhalf_t, N> tmp{src_thread_data};
        static_for<0, N / 2, 1>{}([&](auto i) {
            __builtin_amdgcn_global_atomic_fadd_v2bf16(bit_cast<bhalf2_t*>(addr) + i,
@@ -935,7 +937,6 @@ amd_buffer_atomic_add(const typename vector_type_maker<T, N>::type::type src_thr
    {
        if(dst_thread_element_valid)
        {
-
            amd_global_atomic_add_impl<scalar_t, vector_size>(
                src_thread_data, p_dst_wave + dst_thread_element_offset);
        }