[PyTorch] Fix ONNX export bug with operation-based API (#1320)

Debug ONNX export with te.Sequential ONNX export assumes that all state dict objects are tensor, even extra state. Signed-off-by: Tim Moon <tmoon@nvidia.com>

[PyTorch] Fix ONNX export bug with operation-based API (#1320)
Debug ONNX export with te.Sequential ONNX export assumes that all state dict objects are tensor, even extra state. Signed-off-by: Tim Moon <tmoon@nvidia.com>
c0a539c6 · Tim Moon · GitHub · 943f1e0a · c0a539c6
Unverified Commit c0a539c6 authored Nov 13, 2024 by Tim Moon Committed by GitHub Nov 13, 2024
Show whitespace changes
Inline Side-by-side

Showing with 3 additions and 3 deletions

transformer_engine/pytorch/ops/op.py transformer_engine/pytorch/ops/op.py +3 -3

No files found.
--- a/transformer_engine/pytorch/ops/op.py
+++ b/transformer_engine/pytorch/ops/op.py
@@ -505,7 +505,7 @@ class BasicOperation(FusibleOperation, metaclass=abc.ABCMeta):
            basic_op_kwargs=[kwargs],
        )

-    def get_extra_state(self) -> Optional[torch.Tensor]:
+    def get_extra_state(self) -> torch.Tensor:
        """Serialize extra state

        Contains metadata for FP8 casting.
@@ -534,7 +534,7 @@ class BasicOperation(FusibleOperation, metaclass=abc.ABCMeta):
            self.num_fp8_scales(mode) > 0 for mode in ("input", "param", "grad_output")
        )
        if not has_fp8_state:
-            return None
+            return torch.Tensor()

        def to_cpu(src: torch.Tensor) -> torch.Tensor:
            """Helper function to make CPU copy of tensor
@@ -588,7 +588,7 @@ class BasicOperation(FusibleOperation, metaclass=abc.ABCMeta):

    def set_extra_state(self, state: Optional[torch.Tensor]) -> None:
        """Load extra state"""
-        if state is None:
+        if state is None or state.numel() == 0:
            return

        # Deserialize state from byte tensor