Fixed bugs

35ce337b · Egor Krivov · b43edf56 · 35ce337b · 35ce337b
Commit 35ce337b authored Jul 11, 2025 by Egor Krivov
Hide whitespace changes
Inline Side-by-side

Showing with 4 additions and 3 deletions

bitsandbytes/backends/cuda/ops.py bitsandbytes/backends/cuda/ops.py +1 -1

bitsandbytes/optim/optimizer.py bitsandbytes/optim/optimizer.py +3 -2

No files found.
--- a/bitsandbytes/backends/cuda/ops.py
+++ b/bitsandbytes/backends/cuda/ops.py
@@ -579,7 +579,7 @@ def _optimizer_update_8bit_blockwise_impl(
    g: torch.Tensor,
    p: torch.Tensor,
    state1: torch.Tensor,
-    state2: Optional[torch.nsor],
+    state2: Optional[torch.Tensor],
    beta1: float,
    beta2: float,
    beta3: float,

--- a/bitsandbytes/optim/optimizer.py
+++ b/bitsandbytes/optim/optimizer.py
@@ -280,6 +280,7 @@ class Optimizer8bit(torch.optim.Optimizer):
            self.initialized = True
        # if self.is_paged: self.page_mng.prefetch_all()
+        p = None
        for gindex, group in enumerate(self.param_groups):
            for pindex, p in enumerate(group["params"]):
                if p.grad is None:
@@ -291,10 +292,10 @@ class Optimizer8bit(torch.optim.Optimizer):
                self.prefetch_state(p)
                self.update_step(group, p, gindex, pindex)
                sync_gpu(p)
-        if self.is_paged:
+        if self.is_paged and p is not None:
            # all paged operations are asynchronous, we need
            # to sync to make sure all tensors are in the right state
-            sync_gpu(loss)
+            sync_gpu(p)
        return loss