Make ComputeDataType an optional argument

a30c626b · Bartlomiej Wroblewski · b019d839 · a30c626b · a30c626b · a30c626b
Commit a30c626b authored Sep 27, 2023 by Bartlomiej Wroblewski
6 changed files
--- a/library/src/tensor_operation_instance/gpu/contraction_scale/device_contraction_scale_m2_n2_k2_xdl_c_shuffle_f64_f64_f64_kkn_instance.cpp
+++ b/library/src/tensor_operation_instance/gpu/contraction_scale/device_contraction_scale_m2_n2_k2_xdl_c_shuffle_f64_f64_f64_kkn_instance.cpp
@@ -41,10 +41,10 @@ void add_device_contraction_scale_m2_n2_k2_xdl_c_shuffle_f64_f64_f64_kkn_instanc
                                                           F64,
                                                           Empty_Tuple,
                                                           F64,
-                                                           F64,
                                                           PassThrough,
                                                           PassThrough,
-                                                           Scale>>>& instances)
+                                                           Scale,
+                                                           F64>>>& instances)
 {
    add_device_operation_instances(
        instances, device_contraction_scale_m2_n2_k2_xdl_c_shuffle_f64_f64_f64_kkn_instance{});

--- a/library/src/tensor_operation_instance/gpu/contraction_scale/device_contraction_scale_m2_n2_k2_xdl_c_shuffle_f64_f64_f64_knn_instance.cpp
+++ b/library/src/tensor_operation_instance/gpu/contraction_scale/device_contraction_scale_m2_n2_k2_xdl_c_shuffle_f64_f64_f64_knn_instance.cpp
@@ -41,10 +41,10 @@ void add_device_contraction_scale_m2_n2_k2_xdl_c_shuffle_f64_f64_f64_knn_instanc
                                                           F64,
                                                           Empty_Tuple,
                                                           F64,
-                                                           F64,
                                                           PassThrough,
                                                           PassThrough,
-                                                           Scale>>>& instances)
+                                                           Scale,
+                                                           F64>>>& instances)
 {
    add_device_operation_instances(
        instances, device_contraction_scale_m2_n2_k2_xdl_c_shuffle_f64_f64_f64_knn_instance{});

--- a/library/src/tensor_operation_instance/gpu/contraction_scale/device_contraction_scale_m2_n2_k2_xdl_c_shuffle_f64_f64_f64_mkn_instance.cpp
+++ b/library/src/tensor_operation_instance/gpu/contraction_scale/device_contraction_scale_m2_n2_k2_xdl_c_shuffle_f64_f64_f64_mkn_instance.cpp
@@ -41,10 +41,10 @@ void add_device_contraction_scale_m2_n2_k2_xdl_c_shuffle_f64_f64_f64_mkn_instanc
                                                           F64,
                                                           Empty_Tuple,
                                                           F64,
-                                                           F64,
                                                           PassThrough,
                                                           PassThrough,
-                                                           Scale>>>& instances)
+                                                           Scale,
+                                                           F64>>>& instances)
 {
    add_device_operation_instances(
        instances, device_contraction_scale_m2_n2_k2_xdl_c_shuffle_f64_f64_f64_mkn_instance{});

--- a/library/src/tensor_operation_instance/gpu/contraction_scale/device_contraction_scale_m2_n2_k2_xdl_c_shuffle_f64_f64_f64_mnn_instance.cpp
+++ b/library/src/tensor_operation_instance/gpu/contraction_scale/device_contraction_scale_m2_n2_k2_xdl_c_shuffle_f64_f64_f64_mnn_instance.cpp
@@ -41,10 +41,10 @@ void add_device_contraction_scale_m2_n2_k2_xdl_c_shuffle_f64_f64_f64_mnn_instanc
                                                           F64,
                                                           Empty_Tuple,
                                                           F64,
-                                                           F64,
                                                           PassThrough,
                                                           PassThrough,
-                                                           Scale>>>& instances)
+                                                           Scale,
+                                                           F64>>>& instances)
 {
    add_device_operation_instances(
        instances, device_contraction_scale_m2_n2_k2_xdl_c_shuffle_f64_f64_f64_mnn_instance{});

--- a/profiler/include/profiler/profile_contraction_impl.hpp
+++ b/profiler/include/profiler/profile_contraction_impl.hpp
@@ -124,10 +124,10 @@ int profile_contraction_impl(ck::index_t do_verification,
                                                                              DataType,
                                                                              DTupleDataType,
                                                                              DataType,
-                                                                              ComputeDataType,
                                                                              AElementOp,
                                                                              BElementOp,
-                                                                              CDElementOp>;
+                                                                              CDElementOp,
+                                                                              ComputeDataType>;
    // get device op instances
    const auto op_ptrs = ck::tensor_operation::device::instance::DeviceOperationInstanceFactory<

--- a/test/contraction/test_contraction_interface.cpp
+++ b/test/contraction/test_contraction_interface.cpp
@@ -75,7 +75,6 @@ template <typename DataTypeA,
          typename DataTypeB,
          typename DataTypeC,
          typename DataTypeD,
-          typename DataTypeCompute,
          ck::index_t NumDim>
 class ContractionDeviceOpWrapper
 {
@@ -88,7 +87,6 @@ class ContractionDeviceOpWrapper
                                                                              DataTypeB,
                                                                              ck::Tuple<DataTypeC>,
                                                                              DataTypeD,
-                                                                              DataTypeCompute,
                                                                              Pass,
                                                                              Pass,
                                                                              Bilinear>;
@@ -131,9 +129,9 @@ TEST(TestContractionInterface, IncorrectNumDims)
 {
    std::vector<std::vector<ck::index_t>> Dims    = {{4, 4}, {4, 4, 4, 4}, {4, 4, 4, 4, 4, 4}};
    std::vector<std::vector<ck::index_t>> Strides = {{1, 1}, {1, 1, 1, 1}, {1, 1, 1, 1, 1, 1}};
-    ContractionDeviceOpWrapper<F32, F32, F32, F32, F32, 1> wrapper_1d;
+    ContractionDeviceOpWrapper<F32, F32, F32, F32, 1> wrapper_1d;
-    ContractionDeviceOpWrapper<F32, F32, F32, F32, F32, 2> wrapper_2d;
+    ContractionDeviceOpWrapper<F32, F32, F32, F32, 2> wrapper_2d;
-    ContractionDeviceOpWrapper<F32, F32, F32, F32, F32, 3> wrapper_3d;
+    ContractionDeviceOpWrapper<F32, F32, F32, F32, 3> wrapper_3d;
    EXPECT_FALSE(wrapper_1d.IsSupportedInstance(Dims[0], Strides[0]));
    EXPECT_TRUE(wrapper_2d.IsSupportedInstance(Dims[1], Strides[1]));
    EXPECT_FALSE(wrapper_3d.IsSupportedInstance(Dims[2], Strides[2]));
@@ -143,8 +141,8 @@ TEST(TestContractionInterface, IncorrectDataTypes)
 {
    std::vector<ck::index_t> Dims    = {4, 4, 4, 4};
    std::vector<ck::index_t> Strides = {64, 16, 4, 1};
-    ContractionDeviceOpWrapper<F32, F32, F64, F64, F32, 2> wrapper_1;
+    ContractionDeviceOpWrapper<F32, F32, F64, F64, 2> wrapper_1;
-    ContractionDeviceOpWrapper<F64, F64, F32, F32, F32, 2> wrapper_2;
+    ContractionDeviceOpWrapper<F64, F64, F32, F32, 2> wrapper_2;
    EXPECT_FALSE(wrapper_1.IsSupportedInstance(Dims, Strides));
    EXPECT_FALSE(wrapper_2.IsSupportedInstance(Dims, Strides));
 }