fix awq_dequantize (#4333)

0a3960f2 · Yineng Zhang · GitHub · 07f94463 · 0a3960f2
Unverified Commit 0a3960f2 authored Mar 12, 2025 by Yineng Zhang Committed by GitHub Mar 12, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

sgl-kernel/python/sgl_kernel/gemm.py sgl-kernel/python/sgl_kernel/gemm.py +1 -1

No files found.
--- a/sgl-kernel/python/sgl_kernel/gemm.py
+++ b/sgl-kernel/python/sgl_kernel/gemm.py
@@ -7,7 +7,7 @@ from sgl_kernel.utils import _get_cache_buf, get_cuda_stream
 def awq_dequantize(
    qweight: torch.Tensor, scales: torch.Tensor, qzeros: torch.Tensor
 ) -> torch.ByteTensor:
-    return torch.ops.sgl_kernels.awq_dequantize(qweight, scales, qzeros)
+    return torch.ops.sgl_kernel.awq_dequantize(qweight, scales, qzeros)


 def int8_scaled_mm(mat_a, mat_b, scales_a, scales_b, out_dtype, bias=None):