[JAX] Fix NVTETensor leak in attention.cpp (#1841)

Fix NVTETensor leak in attention.cpp Signed-off-by: Jeremy Berchtold <jberchtold@nvidia.com>

[JAX] Fix NVTETensor leak in attention.cpp (#1841)
Fix NVTETensor leak in attention.cpp Signed-off-by: Jeremy Berchtold <jberchtold@nvidia.com>
f3d77f6c · jberchtold-nvidia · GitHub · c1417116 · f3d77f6c
Unverified Commit f3d77f6c authored Jun 03, 2025 by jberchtold-nvidia Committed by GitHub Jun 03, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 4 additions and 0 deletions

transformer_engine/jax/csrc/extensions/attention.cpp transformer_engine/jax/csrc/extensions/attention.cpp +4 -0

No files found.
--- a/transformer_engine/jax/csrc/extensions/attention.cpp
+++ b/transformer_engine/jax/csrc/extensions/attention.cpp
@@ -199,6 +199,8 @@ pybind11::tuple GetFusedAttnForwardWorkspaceSizes(
    }
  }
+  nvte_tensor_pack_destroy(&aux_output_tensors);
  auto workspace_shape = MakeShapeVector(query_workspace_tensor.shape());
  return pybind11::make_tuple(workspace_shape, query_workspace_tensor.dtype());
 }
@@ -485,6 +487,8 @@ pybind11::tuple GetFusedAttnBackwardWorkspaceSizes(
    }
  }
+  nvte_tensor_pack_destroy(&aux_input_tensors);
  auto work_shape = MakeShapeVector(query_workspace_tensor.shape());
  return pybind11::make_tuple(work_shape, query_workspace_tensor.dtype());
 }