transformer_engine/jax/flax/module.py · a207db1d57b3d3d6aa178f0793b9221fbda7e3db · OpenDAS / TransformerEngine

"transformer_engine/pytorch/quantization.py" did not exist on "868138937dac3be64f5b25d081ff7bf5e2e10433"

[JAX] Refactor + MXFP8 + GroupedGEMM (#1627) · cf9a7c2f

Phuong Nguyen authored Mar 31, 2025



* refactor + mxfp8

* added grouped gemm

* rename linear to dense

* added cublas init phase for groupedGemm

* relax the tol of test encoder multiprocessing mxfp8 by 0.001
Signed-off-by: Phuong Nguyen <phuonguyen@nvidia.com>

---------
Signed-off-by: Phuong Nguyen <phuonguyen@nvidia.com>
Co-authored-by: Hua Huang <huah@nvidia.com>
Co-authored-by: Jeremy Berchtold <jberchtold@nvidia.com>

cf9a7c2f

module.py 51.5 KB

Replace module.py