transformer_engine/jax/cpp_extensions/gemm.py · 5bee81e2f4edc7ff10908d0943cba84a9831fde5 · OpenDAS / TransformerEngine

[JAX] Removes unneccessary reshapes for FP8 GEMM (#1740) · 5bee81e2

Phuong Nguyen authored May 05, 2025



* removes unneccessary reshapes for FP8 GEMM

* use nn.jax.scaled_matmul
Signed-off-by: Phuong Nguyen <phuonguyen@nvidia.com>

---------
Signed-off-by: Phuong Nguyen <phuonguyen@nvidia.com>

5bee81e2

gemm.py 17.3 KB

Replace gemm.py