Revert "[SWDEV-435347] disable instances failed with mainlien compiler (#1077)" (#1101)

This reverts commit ff24b537.

Revert "[SWDEV-435347] disable instances failed with mainlien compiler (#1077)" (#1101)
This reverts commit ff24b537.
a35e466c · Bartłomiej Kocot · GitHub · 20b1ae7c · a35e466c · a35e466c
Unverified Commit a35e466c authored Jan 02, 2024 by Bartłomiej Kocot Committed by GitHub Jan 02, 2024
2 changed files
--- a/library/include/ck/library/tensor_operation_instance/gpu/grouped_convolution_forward_scaleadd_ab.hpp
+++ b/library/include/ck/library/tensor_operation_instance/gpu/grouped_convolution_forward_scaleadd_ab.hpp
@@ -23,20 +23,19 @@ using ScaleAdd    = ck::tensor_operation::element_wise::ScaleAdd;
 #ifdef CK_ENABLE_BF16
 // grouped conv3d forward multi AB scaleadd, NDHWGC/GKZYXC/NDHWGK
-// TODO: Workaround for https://ontrack-internal.amd.com/browse/SWDEV-435347
+void add_device_grouped_conv3d_fwd_xdl_scaleadd_ab_ndhwgc_gkzyxc_ndhwgk_bf16_instances(
-// void add_device_grouped_conv3d_fwd_xdl_scaleadd_ab_ndhwgc_gkzyxc_ndhwgk_bf16_instances(
+    std::vector<std::unique_ptr<DeviceGroupedConvFwdMultipleABD<3,
-//     std::vector<std::unique_ptr<DeviceGroupedConvFwdMultipleABD<3,
+                                                                NDHWGC,
-//                                                                 NDHWGC,
+                                                                GKZYXC,
-//                                                                 GKZYXC,
+                                                                ck::Tuple<>,
-//                                                                 ck::Tuple<>,
+                                                                NDHWGK,
-//                                                                 NDHWGK,
+                                                                ck::Tuple<BF16, BF16>,
-//                                                                 ck::Tuple<BF16, BF16>,
+                                                                ck::Tuple<BF16, BF16>,
-//                                                                 ck::Tuple<BF16, BF16>,
+                                                                ck::Tuple<>,
-//                                                                 ck::Tuple<>,
+                                                                BF16,
-//                                                                 BF16,
+                                                                ScaleAdd,
-//                                                                 ScaleAdd,
+                                                                ScaleAdd,
-//                                                                 ScaleAdd,
+                                                                PassThrough>>>& instances);
-//                                                                 PassThrough>>>& instances);
 #endif
 #ifdef CK_ENABLE_FP16
@@ -152,15 +151,13 @@ struct DeviceOperationInstanceFactory<ck::tensor_operation::device::DeviceGroupe
            }
 #endif
 #ifdef CK_ENABLE_BF16
-            // TODO: Workaround for https://ontrack-internal.amd.com/browse/SWDEV-435347
+            if constexpr(is_same_v<InDataType, ck::Tuple<ck::bhalf_t, ck::bhalf_t>> &&
-            // if constexpr(is_same_v<InDataType, ck::Tuple<ck::bhalf_t, ck::bhalf_t>> &&
+                         is_same_v<WeiDataType, ck::Tuple<ck::bhalf_t, ck::bhalf_t>> &&
-            //              is_same_v<WeiDataType, ck::Tuple<ck::bhalf_t, ck::bhalf_t>> &&
+                         is_same_v<OutDataType, ck::bhalf_t> && is_same_v<ComputeType, ck::bhalf_t>)
-            //              is_same_v<OutDataType, ck::bhalf_t> && is_same_v<ComputeType,
+            {
-            //              ck::bhalf_t>)
+                add_device_grouped_conv3d_fwd_xdl_scaleadd_ab_ndhwgc_gkzyxc_ndhwgk_bf16_instances(
-            // {
+                    op_ptrs);
-            //     add_device_grouped_conv3d_fwd_xdl_scaleadd_ab_ndhwgc_gkzyxc_ndhwgk_bf16_instances(
+            }
-            //         op_ptrs);
-            // }
 #endif
 #ifdef CK_ENABLE_INT8
            if constexpr(is_same_v<InDataType, ck::Tuple<int8_t, int8_t>> &&

--- a/library/src/tensor_operation_instance/gpu/grouped_conv3d_fwd_scaleadd_ab/xdl/device_grouped_conv3d_fwd_xdl_scaleadd_ab_ndhwgc_gkzyxc_ndhwgk_bf16_instance.cpp
+++ b/library/src/tensor_operation_instance/gpu/grouped_conv3d_fwd_scaleadd_ab/xdl/device_grouped_conv3d_fwd_xdl_scaleadd_ab_ndhwgc_gkzyxc_ndhwgk_bf16_instance.cpp
@@ -9,43 +9,42 @@ namespace tensor_operation {
 namespace device {
 namespace instance {
-// TODO: Workaround for https://ontrack-internal.amd.com/browse/SWDEV-435347
+void add_device_grouped_conv3d_fwd_xdl_scaleadd_ab_ndhwgc_gkzyxc_ndhwgk_bf16_instances(
-// void add_device_grouped_conv3d_fwd_xdl_scaleadd_ab_ndhwgc_gkzyxc_ndhwgk_bf16_instances(
+    std::vector<std::unique_ptr<DeviceGroupedConvFwdMultipleABD<3,
-//     std::vector<std::unique_ptr<DeviceGroupedConvFwdMultipleABD<3,
+                                                                NDHWGC,
-//                                                                 NDHWGC,
+                                                                GKZYXC,
-//                                                                 GKZYXC,
+                                                                ck::Tuple<>,
-//                                                                 ck::Tuple<>,
+                                                                NDHWGK,
-//                                                                 NDHWGK,
+                                                                ck::Tuple<BF16, BF16>,
-//                                                                 ck::Tuple<BF16, BF16>,
+                                                                ck::Tuple<BF16, BF16>,
-//                                                                 ck::Tuple<BF16, BF16>,
+                                                                ck::Tuple<>,
-//                                                                 ck::Tuple<>,
+                                                                BF16,
-//                                                                 BF16,
+                                                                ScaleAdd,
-//                                                                 ScaleAdd,
+                                                                ScaleAdd,
-//                                                                 ScaleAdd,
+                                                                PassThrough>>>& instances)
-//                                                                 PassThrough>>>& instances)
+{
-// {
+    add_device_operation_instances(
-//     add_device_operation_instances(
+        instances,
-//         instances,
+        device_grouped_conv_fwd_xdl_scaleadd_ab_bf16_instances<3,
-//         device_grouped_conv_fwd_xdl_scaleadd_ab_bf16_instances<3,
+                                                               NDHWGC,
-//                                                                NDHWGC,
+                                                               GKZYXC,
-//                                                                GKZYXC,
+                                                               NDHWGK,
-//                                                                NDHWGK,
+                                                               ConvFwdDefault>{});
-//                                                                ConvFwdDefault>{});
+    add_device_operation_instances(
-//     add_device_operation_instances(
+        instances,
-//         instances,
+        device_grouped_conv_fwd_xdl_scaleadd_ab_bf16_instances<3,
-//         device_grouped_conv_fwd_xdl_scaleadd_ab_bf16_instances<3,
+                                                               NDHWGC,
-//                                                                NDHWGC,
+                                                               GKZYXC,
-//                                                                GKZYXC,
+                                                               NDHWGK,
-//                                                                NDHWGK,
+                                                               ConvFwd1x1P0>{});
-//                                                                ConvFwd1x1P0>{});
+    add_device_operation_instances(
-//     add_device_operation_instances(
+        instances,
-//         instances,
+        device_grouped_conv_fwd_xdl_scaleadd_ab_bf16_instances<3,
-//         device_grouped_conv_fwd_xdl_scaleadd_ab_bf16_instances<3,
+                                                               NDHWGC,
-//                                                                NDHWGC,
+                                                               GKZYXC,
-//                                                                GKZYXC,
+                                                               NDHWGK,
-//                                                                NDHWGK,
+                                                               ConvFwd1x1S1P0>{});
-//                                                                ConvFwd1x1S1P0>{});
+}
-// }
 } // namespace instance
 } // namespace device