transformer_engine/pytorch/ops/op.py · c1003181dbd5123a3e349266e8dc118f89d78485 · OpenDAS / TransformerEngine

[PyTorch] Set usages for linear op quantizers before forward (#2222) · c1003181

Tim Moon authored Oct 01, 2025



* Make sure to set usages for linear op quantizers before forward
Signed-off-by: Tim Moon <tmoon@nvidia.com>

* Avoid unsupported case for fused dbias+quantize kernel

Hopper does not support dbias + FP8 cast without FP8 transpose.
Signed-off-by: Tim Moon <tmoon@nvidia.com>

---------
Signed-off-by: Tim Moon <tmoon@nvidia.com>

c1003181

op.py 26.5 KB

Replace op.py