Use proper function to get tensor size.

85fb5d15 · Adam Osewski · 66c70dfe · 85fb5d15
Commit 85fb5d15 authored Jan 10, 2024 by Adam Osewski
Show whitespace changes
Inline Side-by-side

Showing with 5 additions and 7 deletions

example/15_grouped_gemm/grouped_gemm_multiple_d_splitk_xdl_fp16.cpp ..._grouped_gemm/grouped_gemm_multiple_d_splitk_xdl_fp16.cpp +5 -7

No files found.
--- a/example/15_grouped_gemm/grouped_gemm_multiple_d_splitk_xdl_fp16.cpp
+++ b/example/15_grouped_gemm/grouped_gemm_multiple_d_splitk_xdl_fp16.cpp
@@ -173,18 +173,16 @@ bool run_grouped_gemm(const ProblemSize& problem_size, const ExecutionConfig& co
    for(int i = 0; i < group_count; i++)
    {
        a_tensors_device.emplace_back(std::make_unique<DeviceMem>(
-            sizeof(ADataType) * problem_size.Ms[i] * problem_size.Ks[i]));
+            a_tensors[i].mDesc.GetElementSpaceSize() * sizeof(ADataType)));
        b_tensors_device.emplace_back(std::make_unique<DeviceMem>(
-            sizeof(BDataType) * problem_size.Ns[i] * problem_size.Ks[i]));
+            b_tensors[i].mDesc.GetElementSpaceSize() * sizeof(BDataType)));
        c_tensors_device.emplace_back(std::make_unique<DeviceMem>(
-            sizeof(EDataType) * problem_size.Ms[i] * problem_size.Ns[i]));
+            c_device_tensors[i].mDesc.GetElementSpaceSize() * sizeof(EDataType)));
-        a_tensors_device[i]->ToDevice(a_tensors[i].mData.data(),
+        a_tensors_device[i]->ToDevice(a_tensors[i].mData.data());
-                                      a_tensors[i].mDesc.GetElementSpaceSize() * sizeof(ADataType));
+        b_tensors_device[i]->ToDevice(b_tensors[i].mData.data());
-        b_tensors_device[i]->ToDevice(b_tensors[i].mData.data(),
-                                      b_tensors[i].mDesc.GetElementSpaceSize() * sizeof(BDataType));
        c_tensors_device[i]->SetZero();
        p_As.push_back(a_tensors_device[i]->GetDeviceBuffer());