Format

ed53d437 · Paul · 6f7ee0b7 · ed53d437 · ed53d437
Commit ed53d437 authored Jul 07, 2022 by Paul
Show whitespace changes
Inline Side-by-side

Showing with 22 additions and 18 deletions

src/targets/gpu/fuse_ops.cpp src/targets/gpu/fuse_ops.cpp +19 -15

src/targets/gpu/gemm_impl.cpp src/targets/gpu/gemm_impl.cpp +3 -3

No files found.
--- a/src/targets/gpu/fuse_ops.cpp
+++ b/src/targets/gpu/fuse_ops.cpp
@@ -1075,8 +1075,10 @@ struct find_contiguous_tranpose_gemm
 {
    auto matcher() const
    {
-        return match::name("gpu::contiguous")(match::arg(0)(match::name("transpose")(match::arg(0)(match::name("gpu::gemm")(match::used_once()).bind("gemm"))).bind("transpose"))
+        return match::name("gpu::contiguous")(match::arg(0)(
-            );
+            match::name("transpose")(
+                match::arg(0)(match::name("gpu::gemm")(match::used_once()).bind("gemm")))
+                .bind("transpose")));
    }
    template <class Vector>
@@ -1099,14 +1101,15 @@ struct find_contiguous_tranpose_gemm
        auto perm      = transpose->get_operator().to_value()["permutation"].to_vector<int64_t>();
        auto iperm     = invert_permutation(perm);
-        if (perm.size() < 3)
+        if(perm.size() < 3)
            return;
-        if (not is_swapped(perm, perm.size() - 3, perm.size() - 2))
+        if(not is_swapped(perm, perm.size() - 3, perm.size() - 2))
            return;
        auto lens = gemm->get_shape().lens();
-        if (lens.size() > 3 and not std::all_of(lens.begin(), lens.end() - 3, [](auto i) { return i == 1; }))
+        if(lens.size() > 3 and
+           not std::all_of(lens.begin(), lens.end() - 3, [](auto i) { return i == 1; }))
            return;
        auto gemmv           = gemm->get_operator().to_value();
@@ -1114,7 +1117,8 @@ struct find_contiguous_tranpose_gemm
        auto s = shape{alloc->get_shape().type(), reorder_dims(alloc->get_shape().lens(), iperm)};
        auto new_alloc = m.insert_instruction(gemm, make_op("allocate", {{"shape", to_value(s)}}));
-        auto alloc_transpose = m.insert_instruction(gemm, make_op("transpose", {{"permutation", perm}}), new_alloc);
+        auto alloc_transpose =
+            m.insert_instruction(gemm, make_op("transpose", {{"permutation", perm}}), new_alloc);
        auto inputs        = gemm->inputs();
        inputs.back()      = alloc_transpose;

--- a/src/targets/gpu/gemm_impl.cpp
+++ b/src/targets/gpu/gemm_impl.cpp
@@ -70,14 +70,14 @@ void blas_shape(const shape& s)
 shape transpose_batch(const shape& s, unsigned trans_batch)
 {
-    if (trans_batch == 0)
+    if(trans_batch == 0)
        return s;
-    if (s.lens().size() < 3)
+    if(s.lens().size() < 3)
        return s;
    auto batch = s.lens().size() - 3;
    std::vector<int64_t> perm(s.lens().size());
    std::iota(perm.begin(), perm.end(), 0);
-    std::swap(perm[batch], perm[batch+trans_batch]);
+    std::swap(perm[batch], perm[batch + trans_batch]);
    return reorder_shape(s, perm);
 }