[MoE][Pytorch]Fix size mismatch error in fp8 transpose. (#988)

Fix size mismatch error in fp8 transpose. Signed-off-by: Dennis Liu <denliu@nvidia.com>

[MoE][Pytorch]Fix size mismatch error in fp8 transpose. (#988)
Fix size mismatch error in fp8 transpose. Signed-off-by: Dennis Liu <denliu@nvidia.com>
e3bb24e5 · Zhenhuan Liu · GitHub · 56e0b351 · e3bb24e5
Unverified Commit e3bb24e5 authored Jul 06, 2024 by Zhenhuan Liu Committed by GitHub Jul 05, 2024
Show whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

transformer_engine/pytorch/csrc/extensions/transpose.cu transformer_engine/pytorch/csrc/extensions/transpose.cu +1 -1

No files found.
--- a/transformer_engine/pytorch/csrc/extensions/transpose.cu
+++ b/transformer_engine/pytorch/csrc/extensions/transpose.cu
@@ -285,9 +285,9 @@ at::Tensor fp8_transpose(at::Tensor input, transformer_engine::DType otype) {

  size_t M = static_cast<size_t>(input.size(0));
  size_t N = static_cast<size_t>(input.size(1));
-  if (M == 0 || N == 0) return input;

  auto output = allocateTorchTensor(input.size(1), input.size(0), DType::kByte);
+  if (M == 0 || N == 0) return output;

  auto input_cu = makeTransformerEngineTensor(input.data_ptr(), {M, N}, otype);
  auto output_cu = makeTransformerEngineTensor(output.data_ptr(), {N, M}, otype);