Remove cpu verion for miopen_add

759daeb6 · Paul · 9fed6960 · 759daeb6 · 759daeb6
Commit 759daeb6 authored Aug 18, 2018 by Paul
Hide whitespace changes
Inline Side-by-side

Showing with 18 additions and 34 deletions

src/include/migraph/check_shapes.hpp src/include/migraph/check_shapes.hpp +2 -2

src/targets/gpu/lowering.cpp src/targets/gpu/lowering.cpp +16 -32

No files found.
--- a/src/include/migraph/check_shapes.hpp
+++ b/src/include/migraph/check_shapes.hpp
@@ -97,8 +97,8 @@ struct check_shapes

    const check_shapes& not_broadcasted() const
    {
-        // if(!this->all_of([](const shape& s) { return not s.broadcasted(); }))
-        // MIGRAPH_THROW(prefix() + "Shapes are broadcasted");
+        if(!this->all_of([](const shape& s) { return not s.broadcasted(); }))
+        MIGRAPH_THROW(prefix() + "Shapes are broadcasted");
        return *this;
    }


--- a/src/targets/gpu/lowering.cpp
+++ b/src/targets/gpu/lowering.cpp
@@ -180,38 +180,22 @@ struct miopen_add
    argument
    compute(context& ctx, const shape& output_shape, const std::vector<argument>& args) const
    {
-        if(args[1].get_shape().broadcasted())
-        {
-            argument result{output_shape};
-
-            visit_all(result, from_gpu(args[0]), from_gpu(args[1]))(
-                [&](auto output, auto input1, auto input2) {
-                    shape_for_each(output.get_shape(), [&](const auto& idx) {
-                        output(idx.begin(), idx.end()) =
-                            input1(idx.begin(), idx.end()) + input2(idx.begin(), idx.end());
-                    });
-                });
-            return to_gpu(result);
-        }
-        else
-        {
-            float alpha = 1, beta = 0;
-            auto a_desc = make_tensor(args[0].get_shape());
-            auto b_desc = make_tensor(args[1].get_shape());
-            auto c_desc = make_tensor(output_shape);
-            miopenOpTensor(ctx.handle.get(),
-                           miopenTensorOpAdd,
-                           &alpha,
-                           a_desc.get(),
-                           args[0].implicit(),
-                           &alpha,
-                           b_desc.get(),
-                           args[1].implicit(),
-                           &beta,
-                           c_desc.get(),
-                           args[2].implicit());
-            return args[2];
-        }
+        float alpha = 1, beta = 0;
+        auto a_desc = make_tensor(args[0].get_shape());
+        auto b_desc = make_tensor(args[1].get_shape());
+        auto c_desc = make_tensor(output_shape);
+        miopenOpTensor(ctx.handle.get(),
+                       miopenTensorOpAdd,
+                       &alpha,
+                       a_desc.get(),
+                       args[0].implicit(),
+                       &alpha,
+                       b_desc.get(),
+                       args[1].implicit(),
+                       &beta,
+                       c_desc.get(),
+                       args[2].implicit());
+        return args[2];
    }
 };