clang format

c9c08eb0 · Shucai Xiao · b16ab01d · c9c08eb0 · c9c08eb0 · c9c08eb0
Commit c9c08eb0 authored Jun 27, 2019 by Shucai Xiao
3 changed files
--- a/src/targets/gpu/device/argmax.cpp
+++ b/src/targets/gpu/device/argmax.cpp
@@ -82,7 +82,7 @@ void argmax(hipStream_t stream, const argument& result, const argument& arg, int
            // load data to lds_data
            size_t round_item_num     = (batch_item_num + block_size - 1) / block_size * block_size;
            size_t remaining_item_num = batch_item_num;
-            data_idx[axis] = 0;
+            data_idx[axis]            = 0;
            lds_data[max_block_size]  = input[arg_s.index(data_idx)];
            lds_index[max_block_size] = 0;
            for(size_t i = thr_idx; i < round_item_num; i += block_size)

--- a/src/targets/gpu/device/argmin.cpp
+++ b/src/targets/gpu/device/argmin.cpp
@@ -82,7 +82,7 @@ void argmin(hipStream_t stream, const argument& result, const argument& arg, int
            // load data to lds_data
            size_t round_item_num     = (batch_item_num + block_size - 1) / block_size * block_size;
            size_t remaining_item_num = batch_item_num;
-            data_idx[axis] = 0;
+            data_idx[axis]            = 0;
            lds_data[max_block_size]  = input[arg_s.index(data_idx)];
            lds_index[max_block_size] = 0;
            for(size_t i = thr_idx; i < round_item_num; i += block_size)

--- a/src/targets/gpu/include/migraphx/gpu/device/reduce_opers.hpp
+++ b/src/targets/gpu/include/migraphx/gpu/device/reduce_opers.hpp
@@ -76,12 +76,12 @@ struct pair_min_op
 template <class T, class Op>
 inline __device__ void block_reduce_pair(T* data_ptr,
-                                     int64_t* index_ptr,
+                                         int64_t* index_ptr,
-                                     Op op,
+                                         Op op,
-                                     std::size_t block_size,
+                                         std::size_t block_size,
-                                     std::size_t thr_idx,
+                                         std::size_t thr_idx,
-                                     std::size_t item_num,
+                                         std::size_t item_num,
-                                     std::size_t output_index)
+                                         std::size_t output_index)
 {
    while(true)
    {
@@ -89,8 +89,9 @@ inline __device__ void block_reduce_pair(T* data_ptr,
        auto size   = item_num / 2;
        for(std::size_t i = thr_idx; i < size; i += block_size)
        {
-            auto output = op({data_ptr[i], index_ptr[i]}, {data_ptr[i + stride], index_ptr[i + stride]});
+            auto output =
-            data_ptr[i] = output.first;
+                op({data_ptr[i], index_ptr[i]}, {data_ptr[i + stride], index_ptr[i + stride]});
+            data_ptr[i]  = output.first;
            index_ptr[i] = output.second;
        }
        __syncthreads();
@@ -102,7 +103,8 @@ inline __device__ void block_reduce_pair(T* data_ptr,
    if(thr_idx == 0)
    {
-        auto output = op({data_ptr[output_index], index_ptr[output_index]}, {data_ptr[0], index_ptr[0]});
+        auto output =
+            op({data_ptr[output_index], index_ptr[output_index]}, {data_ptr[0], index_ptr[0]});
        data_ptr[output_index]  = output.first;
        index_ptr[output_index] = output.second;
    }