Fix the use-after-free bug in unfused normalization (#2002)

Signed-off-by: Przemek Tredak <ptredak@nvidia.com>

Fix the use-after-free bug in unfused normalization (#2002)
Signed-off-by: Przemek Tredak <ptredak@nvidia.com>
5a495a39 · Przemyslaw Tredak · GitHub · aac74427 · 5a495a39
Unverified Commit 5a495a39 authored Jul 28, 2025 by Przemyslaw Tredak Committed by GitHub Jul 28, 2025
Show whitespace changes
Inline Side-by-side

Showing with 2 additions and 2 deletions

transformer_engine/pytorch/csrc/extensions/normalization.cpp transformer_engine/pytorch/csrc/extensions/normalization.cpp +2 -2

No files found.
--- a/transformer_engine/pytorch/csrc/extensions/normalization.cpp
+++ b/transformer_engine/pytorch/csrc/extensions/normalization.cpp
@@ -108,9 +108,9 @@ std::vector<py::object> layernorm_fwd(py::handle input, py::handle weight, Maybe
    }
  }
  TensorWrapper unquantized_out_cu;
+  py::object unquantized_out;
  if (force_unfused_kernel) {
    NoneQuantizer q{none};
-    py::object unquantized_out;
    std::tie(unquantized_out_cu, unquantized_out) = q.create_tensor(size, out_dtype);
  }
  TensorWrapper &kernel_out_cu = force_unfused_kernel ? unquantized_out_cu : out_cu;
@@ -269,9 +269,9 @@ std::vector<py::object> rmsnorm_fwd(const py::handle &input, const py::handle &w
    }
  }
  TensorWrapper unquantized_out_cu;
+  py::object unquantized_out;
  if (force_unfused_kernel) {
    NoneQuantizer q{none};
-    py::object unquantized_out;
    std::tie(unquantized_out_cu, unquantized_out) = q.create_tensor(size, out_dtype);
  }
  TensorWrapper &kernel_out_cu = force_unfused_kernel ? unquantized_out_cu : out_cu;