[PyTorch] Fix high-precision dtype for MXFP8 AG (#2058)

* Fix high-precision dtype for MXFP8 AG Signed-off-by: Kirthi Shankar Sivamani <ksivamani@nvidia.com> * Comment Signed-off-by: Kirthi Shankar Sivamani <ksivamani@nvidia.com> --------- Signed-off-by: Kirthi Shankar Sivamani <ksivamani@nvidia.com>

[PyTorch] Fix high-precision dtype for MXFP8 AG (#2058)
* Fix high-precision dtype for MXFP8 AG Signed-off-by: Kirthi Shankar Sivamani <ksivamani@nvidia.com> * Comment Signed-off-by: Kirthi Shankar Sivamani <ksivamani@nvidia.com> --------- Signed-off-by: Kirthi Shankar Sivamani <ksivamani@nvidia.com>
de6afe24 · Kirthi Shankar Sivamani · GitHub · 077e26c3 · de6afe24
Unverified Commit de6afe24 authored Aug 11, 2025 by Kirthi Shankar Sivamani Committed by GitHub Aug 11, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 3 deletions

transformer_engine/pytorch/distributed.py transformer_engine/pytorch/distributed.py +1 -3

No files found.
--- a/transformer_engine/pytorch/distributed.py
+++ b/transformer_engine/pytorch/distributed.py
@@ -1225,14 +1225,12 @@ def _all_gather_mxfp8(
        if inp._rowwise_data is not None:
            in_shape = inp._rowwise_data.size()
            device = inp._rowwise_data.device
-            dtype = inp._rowwise_data.dtype
        elif inp._columnwise_data is not None:
            in_shape = inp._columnwise_data.size()
            device = inp._columnwise_data.device
-            dtype = inp._columnwise_data.dtype
        else:
            raise ValueError("Got MXFP8 input tensor without any data")
-        dtype = torch.bfloat16
+        dtype = torch.bfloat16  # Guess high-precision dtype.
    else:
        raise ValueError(
            "Invalid type for input tensor (expected torch.Tensor or MXFP8TensorBase, "