Merge branch 'develop_v2.4'

b32741e2 · wenjh · a5892578 · 148b5bea · b32741e2 · b32741e2
Commit b32741e2 authored Jul 15, 2025 by wenjh
Show whitespace changes
Inline Side-by-side

Showing with 4 additions and 5 deletions

transformer_engine/__init__.py transformer_engine/__init__.py +1 -4

transformer_engine/pytorch/utils.py transformer_engine/pytorch/utils.py +3 -1

No files found.
--- a/transformer_engine/__init__.py
+++ b/transformer_engine/__init__.py
@@ -13,9 +13,6 @@ import transformer_engine.common
 try:
    from . import pytorch
 except ImportError:
-    try:
-        from . import pytorch
-    except ImportError:
    pass
 except FileNotFoundError as e:
    if "Could not find shared object file" not in str(e):

--- a/transformer_engine/pytorch/utils.py
+++ b/transformer_engine/pytorch/utils.py
@@ -13,7 +13,6 @@ import torch
 import transformer_engine.pytorch.cpp_extensions as ext
 from . import torch_version
-from ..debug.pytorch.debug_quantization import DebugQuantizedTensor
 from torch.utils.cpp_extension import IS_HIP_EXTENSION
 def requires_grad(*tensors: Tuple[Optional[torch.Tensor], ...]) -> None:
@@ -558,6 +557,7 @@ def round_up_to_nearest_multiple(value, multiple):
 def needs_quantized_gemm(obj, rowwise=True):
    """Used to check if obj will need quantized gemm or normal gemm."""
+    from ..debug.pytorch.debug_quantization import DebugQuantizedTensor
    if isinstance(obj, DebugQuantizedTensor):
        return type(obj.get_tensor(not rowwise)) not in [  # pylint: disable=unidiomatic-typecheck
            torch.Tensor,
@@ -652,3 +652,5 @@ if torch_version() >= (2, 4, 0):
    gpu_autocast_ctx = functools.partial(torch.amp.autocast, device_type="cuda")
 else:
    gpu_autocast_ctx = torch.cuda.amp.autocast
+from ..debug.pytorch.debug_quantization import DebugQuantizedTensor