Fix new gemm

Signed-off-by: wenjh <wenjh@sugon.com>

Fix new gemm
Signed-off-by: wenjh <wenjh@sugon.com>
f796eb80 · wenjh · 04afba37 · f796eb80 · f796eb80
Commit f796eb80 authored Dec 31, 2025 by wenjh
Hide whitespace changes
Inline Side-by-side

Showing with 2 additions and 4 deletions

tests/pytorch/test_batched_linear.py tests/pytorch/test_batched_linear.py +0 -1

tests/pytorch/test_gemm_autotune.py tests/pytorch/test_gemm_autotune.py +2 -3

No files found.
--- a/tests/pytorch/test_batched_linear.py
+++ b/tests/pytorch/test_batched_linear.py
@@ -45,7 +45,6 @@ from transformer_engine.pytorch.attention.inference import InferenceParams
 from transformer_engine.pytorch.distributed import checkpoint as te_checkpoint
 from transformer_engine.pytorch.cpp_extensions import general_gemm, general_grouped_gemm, batchgemm
 from transformer_engine.pytorch.tensor.float8_tensor import Float8Quantizer
-from transformer_engine.pytorch.module.base import get_multi_stream_cublas_workspace, get_workspace
 from transformer_engine.pytorch.utils import get_device_compute_capability
 from transformer_engine.common import recipe
 import transformer_engine_torch as tex

--- a/tests/pytorch/test_gemm_autotune.py
+++ b/tests/pytorch/test_gemm_autotune.py
@@ -13,8 +13,7 @@ import warnings
 import torch
 from torch.utils.cpp_extension import IS_HIP_EXTENSION
-from transformer_engine.pytorch.cpp_extensions import gemm
+from transformer_engine.pytorch.cpp_extensions.gemm import general_gemm
-from transformer_engine.pytorch.module.base import get_workspace
 def use_hipblaslt():
@@ -142,7 +141,7 @@ def run_gemm():
    N = 32
    datatype = torch.float16    
    inp = torch.randn((N, N), device="cuda", dtype=datatype)
-    _, _, _ = gemm(A=inp, B=inp, dtype=datatype, workspace=get_workspace())
+    _, _, _ = general_gemm(A=inp, B=inp, dtype=datatype)
 if __name__ == "__main__":