[PyTorch] Use dummy amax for Float8Tensor cast (#693)

* Avoid updating real during param cast Signed-off-by: Kirthi Shankar Sivamani <ksivamani@nvidia.com> * Review comments Signed-off-by: Kirthi Shankar Sivamani <ksivamani@nvidia.com> --------- Signed-off-by: Kirthi Shankar Sivamani <ksivamani@nvidia.com>

[PyTorch] Use dummy amax for Float8Tensor cast (#693)
* Avoid updating real during param cast Signed-off-by: Kirthi Shankar Sivamani <ksivamani@nvidia.com> * Review comments Signed-off-by: Kirthi Shankar Sivamani <ksivamani@nvidia.com> --------- Signed-off-by: Kirthi Shankar Sivamani <ksivamani@nvidia.com>
4e2ce516 · Kirthi Shankar Sivamani · GitHub · 0bd84ed9 · 4e2ce516
Unverified Commit 4e2ce516 authored Mar 01, 2024 by Kirthi Shankar Sivamani Committed by GitHub Mar 01, 2024
Show whitespace changes
Inline Side-by-side

Showing with 2 additions and 1 deletion

transformer_engine/pytorch/module/base.py transformer_engine/pytorch/module/base.py +2 -1

No files found.
--- a/transformer_engine/pytorch/module/base.py
+++ b/transformer_engine/pytorch/module/base.py
@@ -790,7 +790,8 @@ class TransformerEngineBaseModule(torch.nn.Module, ABC):
                param = Float8Tensor.to_float8(
                    param,
                    fp8_meta=self.fp8_meta,
-                    fp8_meta_index=fp8_meta_index
+                    fp8_meta_index=fp8_meta_index,
+                    amax=torch.empty(1, device="cuda"),  # Dummy amax to avoid overwriting history.
                )
            # Redo parameter wrap in case we broke it above