[PyTorch] Add contiguous check for `te_grouped_gemm` (#1146)

[PyTorch] Add contiguous check for grouped gemm Signed-off-by: beinggod <zhangruibin@01.ai> Co-authored-by: beinggod <zhangruibin@01.ai> Co-authored-by: Kirthi Shankar Sivamani <ksivamani@nvidia.com>

[PyTorch] Add contiguous check for `te_grouped_gemm` (#1146)
[PyTorch] Add contiguous check for grouped gemm Signed-off-by: beinggod <zhangruibin@01.ai> Co-authored-by: beinggod <zhangruibin@01.ai> Co-authored-by: Kirthi Shankar Sivamani <ksivamani@nvidia.com>
ddc5774d · Ruibin Cheung · GitHub · 93f00a79 · ddc5774d
Unverified Commit ddc5774d authored Sep 04, 2024 by Ruibin Cheung Committed by GitHub Sep 03, 2024
Show whitespace changes
Inline Side-by-side

Showing with 5 additions and 0 deletions

transformer_engine/pytorch/csrc/extensions/gemm.cu transformer_engine/pytorch/csrc/extensions/gemm.cu +5 -0

No files found.
--- a/transformer_engine/pytorch/csrc/extensions/gemm.cu
+++ b/transformer_engine/pytorch/csrc/extensions/gemm.cu
@@ -115,6 +115,11 @@ void te_grouped_gemm(std::vector<at::Tensor> A, at::Tensor A_scale_inverse, int
      if (pre_gelu_out[i].data_ptr() != nullptr) pre_gelu_out[i].zero_();
      continue;
    }
+
+    NVTE_CHECK(A[i].is_contiguous(), "A[", i, "] must be contiguous.");
+    NVTE_CHECK(B[i].is_contiguous(), "B[", i, "] must be contiguous.");
+    NVTE_CHECK(D[i].is_contiguous(), "D[", i, "] must be contiguous.");
+
    te_A.emplace_back(make_tensor(
        A[i].data_ptr(), {static_cast<size_t>(A[i].size(0)), static_cast<size_t>(A[i].size(1))},
        A_type, nullptr, nullptr, getDataPtr(A_scale_inverse, A_offset + i)));