Support quantization for non piecewise linear function

750861a9 · rocking · 9c577e08 · 750861a9
Commit 750861a9 authored Oct 18, 2022 by rocking
Show whitespace changes
Inline Side-by-side

Showing with 24 additions and 0 deletions

include/ck/tensor_operation/gpu/element/quantization_operation.hpp ...k/tensor_operation/gpu/element/quantization_operation.hpp +24 -0

No files found.
--- a/include/ck/tensor_operation/gpu/element/quantization_operation.hpp
+++ b/include/ck/tensor_operation/gpu/element/quantization_operation.hpp
@@ -57,6 +57,30 @@ struct Add_Activation_Mul_Clamp
    Activation activationOp_;
 };

+// For Activation function which is non piecewise linear function, such as TanH, Sigmoid ...etc
+template <typename Activation>
+struct Add_Mul_Activation_Mul_Clamp
+{
+    Add_Mul_Activation_Mul_Clamp(float multiplier1, float multiplier2, Activation activationOp)
+        : multiplier1_(multiplier1), multiplier2_(multiplier2), activationOp_(activationOp)
+    {
+    }
+
+    __host__ __device__ constexpr void
+    operator()(int8_t& y, const int32_t& x1, const int32_t& x2) const
+    {
+        float y_fp32 = ck::type_convert<float>(x1 + x2);
+        y_fp32       = multiplier1_ * y_fp32;
+        activationOp_(y_fp32, y_fp32);
+        y_fp32 = math::clamp(multiplier2_ * y_fp32, -128.f, 127.f);
+        y      = ck::type_convert<int8_t>(y_fp32);
+    }
+
+    float multiplier1_;
+    float multiplier2_;
+    Activation activationOp_;
+};
+
 } // namespace element_wise
 } // namespace tensor_operation
 } // namespace ck