add builder

1cda3b80 · ltqin · 7b73260c · 1cda3b80 · 1cda3b80 · 1cda3b80
Commit 1cda3b80 authored Apr 21, 2023 by ltqin
7 changed files
--- a/library/include/ck/library/tensor_operation_instance/add_device_operation_instance.hpp
+++ b/library/include/ck/library/tensor_operation_instance/add_device_operation_instance.hpp
@@ -36,6 +36,9 @@ enum struct ArchitectureEnum
 };
 template <typename DeviceOp, ArchitectureEnum Arch = ArchitectureEnum::Xdl>
 struct DeviceOperationInstanceCreator;
+template <typename DeviceOp, ArchitectureEnum Arch>
+struct DeviceOperationInstanceBuilder;
 } // namespace instance
 } // namespace device
 } // namespace tensor_operation

--- a/library/include/ck/library/tensor_operation_instance/gpu/batched_gemm_softmax_gemm_permute/batched_gemm_softmax_gemm_permute.hpp
+++ b/library/include/ck/library/tensor_operation_instance/gpu/batched_gemm_softmax_gemm_permute/batched_gemm_softmax_gemm_permute.hpp
@@ -35,25 +35,25 @@ template <index_t NumDimG,
          typename B1ElementwiseOperation,
          typename C1DEElementwiseOperation,
          MaskingSpecialization MaskingSpec,
-          ArchitectureEnum Arch = ArchitectureEnum::Xdl>
+          ArchitectureEnum Arch>
-void add_device_instances(
+struct DeviceOperationInstanceBuilder<DeviceBatchedGemmSoftmaxGemmPermute<NumDimG,
-    std::vector<std::unique_ptr<DeviceBatchedGemmSoftmaxGemmPermute<NumDimG,
+                                                                          NumDimM,
-                                                                    NumDimM,
+                                                                          NumDimN,
-                                                                    NumDimN,
+                                                                          NumDimK,
-                                                                    NumDimK,
+                                                                          NumDimO,
-                                                                    NumDimO,
+                                                                          ADataType,
-                                                                    ADataType,
+                                                                          B0DataType,
-                                                                    B0DataType,
+                                                                          B1DataType,
-                                                                    B1DataType,
+                                                                          CDataType,
-                                                                    CDataType,
+                                                                          Acc0BiasDataType,
-                                                                    Acc0BiasDataType,
+                                                                          Acc1BiasDataType,
-                                                                    Acc1BiasDataType,
+                                                                          AElementwiseOperation,
-                                                                    AElementwiseOperation,
+                                                                          B0ElementwiseOperation,
-                                                                    B0ElementwiseOperation,
+                                                                          C0DEElementwiseOperation,
-                                                                    C0DEElementwiseOperation,
+                                                                          B1ElementwiseOperation,
-                                                                    B1ElementwiseOperation,
+                                                                          C1DEElementwiseOperation,
-                                                                    C1DEElementwiseOperation,
+                                                                          MaskingSpec>,
-                                                                    MaskingSpec>>>& instances)
+                                      Arch>
 {
    using DeviceOp = DeviceBatchedGemmSoftmaxGemmPermute<NumDimG,
                                                         NumDimM,
@@ -72,9 +72,13 @@ void add_device_instances(
                                                         B1ElementwiseOperation,
                                                         C1DEElementwiseOperation,
                                                         MaskingSpec>;
-    add_device_operation_instances(
+    static void add_device_instances(std::vector<std::unique_ptr<DeviceOp>>& instances)
-        instances, DeviceOperationInstanceCreator<DeviceOp, Arch>::create_device_instances());
+    {
-}
+        add_device_operation_instances(
+            instances, DeviceOperationInstanceCreator<DeviceOp, Arch>::create_device_instances());
+    }
+};
 } // namespace instance
 } // namespace device
 } // namespace tensor_operation

--- a/library/src/tensor_operation_instance/gpu/batched_gemm_softmax_gemm_permute/device_batched_gemm_bias_softmax_gemm_permute_xdl_cshuffle_bf16_bf16_bf16_bf16_gmk_gnk_gno_gmo_instance.cpp
+++ b/library/src/tensor_operation_instance/gpu/batched_gemm_softmax_gemm_permute/device_batched_gemm_bias_softmax_gemm_permute_xdl_cshuffle_bf16_bf16_bf16_bf16_gmk_gnk_gno_gmo_instance.cpp
@@ -47,7 +47,27 @@ void add_device_batched_gemm_softmax_gemm_permute_xdl_cshuffle_gmk_gnk_gno_gmo_i
                                            MaskingSpecialization::MaskOutUpperTriangle>>>&
        instances)
 {
-    add_device_instances(instances);
+    using DeviceOp =
+        DeviceBatchedGemmSoftmaxGemmPermute<2,
+                                            1,
+                                            1,
+                                            1,
+                                            1,
+                                            BF16,
+                                            BF16,
+                                            BF16,
+                                            BF16,
+                                            ck::Tuple<BF16>,
+                                            ck::Tuple<>,
+                                            PassThrough,
+                                            PassThrough,
+                                            ScaleAdd,
+                                            PassThrough,
+                                            PassThrough,
+                                            MaskingSpecialization::MaskOutUpperTriangle>;
+    DeviceOperationInstanceBuilder<DeviceOp, ArchitectureEnum::Xdl>::add_device_instances(
+        instances);
 }
 void add_device_batched_gemm_softmax_gemm_permute_xdl_cshuffle_gmk_gnk_gno_gmo_instances(
@@ -71,7 +91,25 @@ void add_device_batched_gemm_softmax_gemm_permute_xdl_cshuffle_gmk_gnk_gno_gmo_i
                                                            MaskingSpecialization::MaskDisabled>>>&
        instances)
 {
-    add_device_instances(instances);
+    using DeviceOp = DeviceBatchedGemmSoftmaxGemmPermute<2,
+                                                         1,
+                                                         1,
+                                                         1,
+                                                         1,
+                                                         BF16,
+                                                         BF16,
+                                                         BF16,
+                                                         BF16,
+                                                         ck::Tuple<BF16>,
+                                                         ck::Tuple<>,
+                                                         PassThrough,
+                                                         PassThrough,
+                                                         ScaleAdd,
+                                                         PassThrough,
+                                                         PassThrough,
+                                                         MaskingSpecialization::MaskDisabled>;
+    DeviceOperationInstanceBuilder<DeviceOp, ArchitectureEnum::Xdl>::add_device_instances(
+        instances);
 }
 } // namespace instance

--- a/library/src/tensor_operation_instance/gpu/batched_gemm_softmax_gemm_permute/device_batched_gemm_bias_softmax_gemm_permute_xdl_cshuffle_f16_f16_f16_f16_gmk_gnk_gno_gmo_instance.cpp
+++ b/library/src/tensor_operation_instance/gpu/batched_gemm_softmax_gemm_permute/device_batched_gemm_bias_softmax_gemm_permute_xdl_cshuffle_f16_f16_f16_f16_gmk_gnk_gno_gmo_instance.cpp
@@ -47,7 +47,26 @@ void add_device_batched_gemm_softmax_gemm_permute_xdl_cshuffle_gmk_gnk_gno_gmo_i
                                            MaskingSpecialization::MaskOutUpperTriangle>>>&
        instances)
 {
-    add_device_instances(instances);
+    using DeviceOp =
+        DeviceBatchedGemmSoftmaxGemmPermute<2,
+                                            1,
+                                            1,
+                                            1,
+                                            1,
+                                            F16,
+                                            F16,
+                                            F16,
+                                            F16,
+                                            ck::Tuple<F16>,
+                                            ck::Tuple<>,
+                                            PassThrough,
+                                            PassThrough,
+                                            ScaleAdd,
+                                            PassThrough,
+                                            PassThrough,
+                                            MaskingSpecialization::MaskOutUpperTriangle>;
+    DeviceOperationInstanceBuilder<DeviceOp, ArchitectureEnum::Xdl>::add_device_instances(
+        instances);
 }
 void add_device_batched_gemm_softmax_gemm_permute_xdl_cshuffle_gmk_gnk_gno_gmo_instances(
@@ -71,7 +90,25 @@ void add_device_batched_gemm_softmax_gemm_permute_xdl_cshuffle_gmk_gnk_gno_gmo_i
                                                            MaskingSpecialization::MaskDisabled>>>&
        instances)
 {
-    add_device_instances(instances);
+    using DeviceOp = DeviceBatchedGemmSoftmaxGemmPermute<2,
+                                                         1,
+                                                         1,
+                                                         1,
+                                                         1,
+                                                         F16,
+                                                         F16,
+                                                         F16,
+                                                         F16,
+                                                         ck::Tuple<F16>,
+                                                         ck::Tuple<>,
+                                                         PassThrough,
+                                                         PassThrough,
+                                                         ScaleAdd,
+                                                         PassThrough,
+                                                         PassThrough,
+                                                         MaskingSpecialization::MaskDisabled>;
+    DeviceOperationInstanceBuilder<DeviceOp, ArchitectureEnum::Xdl>::add_device_instances(
+        instances);
 }
 } // namespace instance

--- a/library/src/tensor_operation_instance/gpu/batched_gemm_softmax_gemm_permute/device_batched_gemm_softmax_gemm_permute_xdl_cshuffle_bf16_bf16_bf16_bf16_gmk_gnk_gno_gmo_instance.cpp
+++ b/library/src/tensor_operation_instance/gpu/batched_gemm_softmax_gemm_permute/device_batched_gemm_softmax_gemm_permute_xdl_cshuffle_bf16_bf16_bf16_bf16_gmk_gnk_gno_gmo_instance.cpp
@@ -47,7 +47,26 @@ void add_device_batched_gemm_softmax_gemm_permute_xdl_cshuffle_gmk_gnk_gno_gmo_i
                                            MaskingSpecialization::MaskOutUpperTriangle>>>&
        instances)
 {
-    add_device_instances(instances);
+    using DeviceOp =
+        DeviceBatchedGemmSoftmaxGemmPermute<2,
+                                            1,
+                                            1,
+                                            1,
+                                            1,
+                                            BF16,
+                                            BF16,
+                                            BF16,
+                                            BF16,
+                                            ck::Tuple<>,
+                                            ck::Tuple<>,
+                                            PassThrough,
+                                            PassThrough,
+                                            Scale,
+                                            PassThrough,
+                                            PassThrough,
+                                            MaskingSpecialization::MaskOutUpperTriangle>;
+    DeviceOperationInstanceBuilder<DeviceOp, ArchitectureEnum::Xdl>::add_device_instances(
+        instances);
 }
 void add_device_batched_gemm_softmax_gemm_permute_xdl_cshuffle_gmk_gnk_gno_gmo_instances(
@@ -71,7 +90,25 @@ void add_device_batched_gemm_softmax_gemm_permute_xdl_cshuffle_gmk_gnk_gno_gmo_i
                                                            MaskingSpecialization::MaskDisabled>>>&
        instances)
 {
-    add_device_instances(instances);
+    using DeviceOp = DeviceBatchedGemmSoftmaxGemmPermute<2,
+                                                         1,
+                                                         1,
+                                                         1,
+                                                         1,
+                                                         BF16,
+                                                         BF16,
+                                                         BF16,
+                                                         BF16,
+                                                         ck::Tuple<>,
+                                                         ck::Tuple<>,
+                                                         PassThrough,
+                                                         PassThrough,
+                                                         Scale,
+                                                         PassThrough,
+                                                         PassThrough,
+                                                         MaskingSpecialization::MaskDisabled>;
+    DeviceOperationInstanceBuilder<DeviceOp, ArchitectureEnum::Xdl>::add_device_instances(
+        instances);
 }
 } // namespace instance

--- a/library/src/tensor_operation_instance/gpu/batched_gemm_softmax_gemm_permute/device_batched_gemm_softmax_gemm_permute_xdl_cshuffle_f16_f16_f16_f16_gmk_gnk_gno_gmo_instance.cpp
+++ b/library/src/tensor_operation_instance/gpu/batched_gemm_softmax_gemm_permute/device_batched_gemm_softmax_gemm_permute_xdl_cshuffle_f16_f16_f16_f16_gmk_gnk_gno_gmo_instance.cpp
@@ -47,7 +47,26 @@ void add_device_batched_gemm_softmax_gemm_permute_xdl_cshuffle_gmk_gnk_gno_gmo_i
                                            MaskingSpecialization::MaskOutUpperTriangle>>>&
        instances)
 {
-    add_device_instances(instances);
+    using DeviceOp =
+        DeviceBatchedGemmSoftmaxGemmPermute<2,
+                                            1,
+                                            1,
+                                            1,
+                                            1,
+                                            F16,
+                                            F16,
+                                            F16,
+                                            F16,
+                                            ck::Tuple<>,
+                                            ck::Tuple<>,
+                                            PassThrough,
+                                            PassThrough,
+                                            Scale,
+                                            PassThrough,
+                                            PassThrough,
+                                            MaskingSpecialization::MaskOutUpperTriangle>;
+    DeviceOperationInstanceBuilder<DeviceOp, ArchitectureEnum::Xdl>::add_device_instances(
+        instances);
 }
 void add_device_batched_gemm_softmax_gemm_permute_xdl_cshuffle_gmk_gnk_gno_gmo_instances(
    std::vector<
@@ -70,7 +89,25 @@ void add_device_batched_gemm_softmax_gemm_permute_xdl_cshuffle_gmk_gnk_gno_gmo_i
                                                            MaskingSpecialization::MaskDisabled>>>&
        instances)
 {
-    add_device_instances(instances);
+    using DeviceOp = DeviceBatchedGemmSoftmaxGemmPermute<2,
+                                                         1,
+                                                         1,
+                                                         1,
+                                                         1,
+                                                         F16,
+                                                         F16,
+                                                         F16,
+                                                         F16,
+                                                         ck::Tuple<>,
+                                                         ck::Tuple<>,
+                                                         PassThrough,
+                                                         PassThrough,
+                                                         Scale,
+                                                         PassThrough,
+                                                         PassThrough,
+                                                         MaskingSpecialization::MaskDisabled>;
+    DeviceOperationInstanceBuilder<DeviceOp, ArchitectureEnum::Xdl>::add_device_instances(
+        instances);
 }
 } // namespace instance

--- a/src_example/01_gemm_bias_softmax_gemm_permute/gemm_bias_softmax_gemm_permute.cpp
+++ b/src_example/01_gemm_bias_softmax_gemm_permute/gemm_bias_softmax_gemm_permute.cpp
@@ -135,25 +135,10 @@ int main()
    // get device op instances
    std::vector<std::unique_ptr<DeviceOp>> op_ptrs;
-    ck::tensor_operation::device::instance::add_device_instances<
+    ck::tensor_operation::device::instance::DeviceOperationInstanceBuilder<
-        2,
+        DeviceOp,
-        1,
+        ck::tensor_operation::device::instance::ArchitectureEnum::Xdl>::
-        1,
+        add_device_instances(op_ptrs);
-        1,
-        1,
-        ADataType,
-        B0DataType,
-        B1DataType,
-        CDataType,
-        ck::Tuple<D00DataType, D01DataType>,
-        ck::Tuple<>,
-        AElementOp,
-        B0ElementOp,
-        Acc0ElementOp,
-        B1ElementOp,
-        CElementOp,
-        MaskingSpec,
-        ck::tensor_operation::device::instance::ArchitectureEnum::Xdl>(op_ptrs);
    std::cout << "found " << op_ptrs.size() << " instances" << std::endl;