handling the cases that not enough actv functions are provided.

22f8a479 · Shucai Xiao · 0cc5b80e · 22f8a479 · 22f8a479 · 22f8a479
Commit 22f8a479 authored Feb 04, 2019 by Shucai Xiao
4 changed files
--- a/src/include/migraphx/operators.hpp
+++ b/src/include/migraphx/operators.hpp
@@ -1140,7 +1140,7 @@ struct rnn
    };
    std::size_t hidden_size = 1;
-    std::vector<operation> actv_funcs{tanh{}};
+    std::vector<operation> actv_funcs{tanh{}, tanh{}};
    rnn_direction_t direction = forward;
    float clip                = 0.0f;

--- a/src/include/migraphx/rewrite_rnn.hpp
+++ b/src/include/migraphx/rewrite_rnn.hpp
@@ -30,6 +30,8 @@ struct rewrite_rnn
                                          instruction_ref bias,
                                          instruction_ref ih,
                                          operation& actv_func) const;
+    std::vector<operation> compute_actv_funcs(instruction_ref ins) const;
 };
 } // namespace MIGRAPHX_INLINE_NS

--- a/src/rewrite_rnn.cpp
+++ b/src/rewrite_rnn.cpp
@@ -29,9 +29,10 @@ void rewrite_rnn::apply(program& prog) const
            migraphx::shape ih_shape{type, {1, batch_size, hidden_size}};
            std::vector<float> data(ih_shape.elements(), 0);
+            auto actv_funcs = compute_actv_funcs(ins);
            auto rnn_op                    = any_cast<op::rnn>(ins->get_operator());
            op::rnn::rnn_direction_t dicrt = rnn_op.direction;
-            if(dicrt == op::rnn::rnn_direction_t::bidirectional)
+            if(dicrt == op::rnn::bidirectional)
            {
                // input weight matrix
                auto w_forward = prog.insert_instruction(ins, op::slice{{0}, {0}, {1}}, args[1]);
@@ -72,7 +73,7 @@ void rewrite_rnn::apply(program& prog) const
                                            r_forward,
                                            bias_forward,
                                            ih_forward,
-                                            rnn_op.actv_funcs.at(0));
+                                            actv_funcs.at(0));
                auto ret_reverse = rnn_cell(false,
                                            prog,
                                            ins,
@@ -81,7 +82,7 @@ void rewrite_rnn::apply(program& prog) const
                                            r_reverse,
                                            bias_reverse,
                                            ih_reverse,
-                                            rnn_op.actv_funcs.at(1));
+                                            actv_funcs.at(1));
                auto concat_output =
                    prog.insert_instruction(ins, op::concat{1}, ret_forward[1], ret_reverse[1]);
@@ -109,7 +110,7 @@ void rewrite_rnn::apply(program& prog) const
            }
            else
            {
-                bool is_forward = (dicrt == op::rnn::rnn_direction_t::forward);
+                bool is_forward = (dicrt == op::rnn::forward);
                // input weight matrix
                auto w = args[1];
@@ -135,7 +136,7 @@ void rewrite_rnn::apply(program& prog) const
                }
                auto ret = rnn_cell(
-                    is_forward, prog, ins, args[0], w, r, bias, ih, rnn_op.actv_funcs.at(0));
+                    is_forward, prog, ins, args[0], w, r, bias, ih, actv_funcs.at(0));
                auto last_output = prog.insert_instruction(ins, op::squeeze{{0}}, ret[1]);
                // following logic is to ensure the last instruction is a
@@ -263,5 +264,42 @@ std::vector<instruction_ref> rewrite_rnn::rnn_cell(bool is_forward,
    return {hidden_out, last_out};
 }
+std::vector<operation> rewrite_rnn::compute_actv_funcs(instruction_ref ins) const
+{
+    auto rnn_op = any_cast<op::rnn>(ins->get_operator());
+    // before rewrite the rnn operator, need to ensure
+    // we have 2 actv funcs. If less than 2, use the 
+    // algorithm in parse_rnn to make 2 actv functions
+    if (rnn_op.direction == op::rnn::bidirectional)
+    {
+        if (rnn_op.actv_funcs.size() == 0)
+        {
+            // default is tanh
+            return {op::tanh{}, op::tanh{}};
+        }
+        else if (rnn_op.actv_funcs.size() == 1)
+        {
+            return {rnn_op.actv_funcs.at(0), rnn_op.actv_funcs.at(0)};
+        }
+        else
+        {
+            return rnn_op.actv_funcs;
+        }
+    }
+    else
+    {
+        if (rnn_op.actv_funcs.size() == 0)
+        {
+            // default is tanh
+            return {op::tanh{}};
+        }
+        else
+        {
+            return rnn_op.actv_funcs;
+        }
+    }
+}
 } // namespace MIGRAPHX_INLINE_NS
 } // namespace migraphx
--- a/test/cpu_ops_test.cpp
+++ b/test/cpu_ops_test.cpp
@@ -1459,7 +1459,7 @@ TEST_CASE(rnn_forward)
        auto out_hs =
            p.add_instruction(migraphx::op::rnn{hidden_size,
-                                                {migraphx::op::tanh{}, migraphx::op::tanh{}},
+                                                {},
                                                migraphx::op::rnn::forward,
                                                clip},
                              seq,
@@ -1599,7 +1599,7 @@ TEST_CASE(rnn_reverse)
        auto out_hs =
            p.add_instruction(migraphx::op::rnn{hidden_size,
-                                                {migraphx::op::tanh{}, migraphx::op::tanh{}},
+                                                {},
                                                migraphx::op::rnn::reverse,
                                                clip},
                              seq,
@@ -1724,7 +1724,7 @@ TEST_CASE(rnn_bidirectional)
        auto und  = p.add_instruction(migraphx::op::undefined{});
        p.add_instruction(migraphx::op::rnn{hidden_size,
-                                            {migraphx::op::tanh{}, migraphx::op::tanh{}},
+                                            {},
                                            migraphx::op::rnn::bidirectional,
                                            clip},
                          seq,
@@ -1776,7 +1776,7 @@ TEST_CASE(rnn_bidirectional)
        auto out_hs =
            p.add_instruction(migraphx::op::rnn{hidden_size,
-                                                {migraphx::op::tanh{}, migraphx::op::tanh{}},
+                                                {migraphx::op::tanh{}},
                                                migraphx::op::rnn::bidirectional,
                                                clip},
                              seq,