Moved int8_mm_dequant to default backend (#1626)

27d916b3 · Egor · GitHub · 8b858e4e · 27d916b3 · 27d916b3
Unverified Commit 27d916b3 authored May 07, 2025 by Egor Committed by GitHub May 07, 2025
Show whitespace changes
Inline Side-by-side

Showing with 23 additions and 24 deletions

bitsandbytes/backends/cpu/ops.py bitsandbytes/backends/cpu/ops.py +0 -24

bitsandbytes/backends/default/ops.py bitsandbytes/backends/default/ops.py +23 -0

No files found.
--- a/bitsandbytes/backends/cpu/ops.py
+++ b/bitsandbytes/backends/cpu/ops.py
 from collections.abc import Sequence
 import ctypes as ct
-from typing import Optional

 import torch

@@ -24,29 +23,6 @@ if torch.__version__ >= (2, 6):
        ).reshape(*A.shape[:-1], B.shape[0])


-@register_kernel("bitsandbytes::int8_mm_dequant", "cpu")
-def _(
-    A: torch.Tensor,
-    row_stats: torch.Tensor,
-    col_stats: torch.Tensor,
-    dtype: Optional[torch.dtype] = None,
-    bias: Optional[torch.Tensor] = None,
-) -> torch.Tensor:
-    torch._check(A.dtype == torch.int32, lambda: f"A must be int32, got {A.dtype}")
-    torch._check(row_stats.dtype == torch.float32, lambda: f"row_stats must be float32, got {row_stats.dtype}")
-    torch._check(col_stats.dtype == torch.float32, lambda: f"col_stats must be float32, got {col_stats.dtype}")
-
-    A_calc = A.view(-1, A.shape[-1])
-    row_stats = row_stats.reshape(-1).unsqueeze(-1)
-    col_stats = col_stats.reshape(-1).unsqueeze(0)
-
-    out = A_calc * (row_stats * col_stats) * 6.200124e-05
-    if bias is not None:
-        out += bias
-
-    return out.to(dtype or torch.float16)
-
-
 @register_kernel("bitsandbytes::quantize_blockwise", "cpu")
 def _(A: torch.Tensor, code: torch.Tensor, blocksize: int) -> tuple[torch.Tensor, torch.Tensor]:
    torch._check_is_size(blocksize)

--- a/bitsandbytes/backends/default/ops.py
+++ b/bitsandbytes/backends/default/ops.py
@@ -6,6 +6,29 @@ import torch
 from ..._ops import register_kernel


+@register_kernel("bitsandbytes::int8_mm_dequant", "default")
+def _(
+    A: torch.Tensor,
+    row_stats: torch.Tensor,
+    col_stats: torch.Tensor,
+    dtype: Optional[torch.dtype] = None,
+    bias: Optional[torch.Tensor] = None,
+) -> torch.Tensor:
+    torch._check(A.dtype == torch.int32, lambda: f"A must be int32, got {A.dtype}")
+    torch._check(row_stats.dtype == torch.float32, lambda: f"row_stats must be float32, got {row_stats.dtype}")
+    torch._check(col_stats.dtype == torch.float32, lambda: f"col_stats must be float32, got {col_stats.dtype}")
+
+    A_calc = A.view(-1, A.shape[-1])
+    row_stats = row_stats.reshape(-1).unsqueeze(-1)
+    col_stats = col_stats.reshape(-1).unsqueeze(0)
+
+    out = A_calc * (row_stats * col_stats) * 6.200124e-05
+    if bias is not None:
+        out += bias
+
+    return out.to(dtype or torch.float16)
+
+
 @register_kernel("bitsandbytes::int8_mixed_scaled_mm", "default")
 def _(
    A: torch.Tensor,