fixed a bug in the int8 quantization function

5447f39c · Shucai Xiao · 965ac6fc · 5447f39c
Commit 5447f39c authored Aug 08, 2019 by Shucai Xiao
Show whitespace changes
Inline Side-by-side

Showing with 25 additions and 4 deletions

src/quantization.cpp src/quantization.cpp +25 -4

No files found.
--- a/src/quantization.cpp
+++ b/src/quantization.cpp
@@ -301,10 +301,14 @@ void quantize_int8(program& prog,
            else
            {
                auto q_dot = prog.insert_instruction(ins, op::quant_dot{1, 0}, converted_inputs);
+                auto f_dot = prog.insert_instruction(ins, op::convert{shape::float_type}, q_dot);
+                auto c_shape  = q_dot->get_shape();
+                std::vector<float> vec_alpha(c_shape.elements(), new_alpha);
+                auto l_alpha = prog.add_literal(literal({shape::float_type, c_shape.lens()}, vec_alpha));
                if(inputs.size() == 3 and dot_op.beta != 0.0f)
                {
-                    auto alpha_ab = prog.insert_instruction(ins, op::convert{orig_type}, q_dot);
+                    auto alpha_ab = prog.insert_instruction(ins, op::mul{}, l_alpha, f_dot);
-                    auto c_shape  = q_dot->get_shape();
                    std::vector<float> vec_beta(c_shape.elements(), dot_op.beta);
                    auto l_beta =
                        prog.add_literal(literal({shape::float_type, c_shape.lens()}, vec_beta));
@@ -320,11 +324,28 @@ void quantize_int8(program& prog,
                    {
                        beta_c = prog.insert_instruction(ins, op::mul{}, l_beta, inputs.back());
                    }
+                    if (orig_type == shape::float_type)
+                    {
                        prog.replace_instruction(ins, op::add{}, alpha_ab, beta_c);
                    }
                    else
                    {
-                    prog.replace_instruction(ins, op::convert{orig_type}, q_dot);
+                        auto f_res = prog.insert_instruction(ins, op::add{}, alpha_ab, beta_c);
+                        prog.replace_instruction(ins, op::convert{orig_type}, f_res);
+                    }                    
+                }
+                else
+                {
+                    if (orig_type == shape::float_type)
+                    {
+                        prog.replace_instruction(ins, op::mul{}, l_alpha, f_dot);
+                    }
+                    else
+                    {
+                        auto alpha_ab = prog.insert_instruction(ins, op::mul{}, l_alpha, f_dot);
+                        prog.replace_instruction(ins, op::convert{orig_type}, alpha_ab);                        
+                    }
                }
            }
        }