Lint fix

4b025748 · Matthew Douglas · 1813b058 · 4b025748 · 4b025748 · 4b025748
Commit 4b025748 authored Sep 15, 2025 by Matthew Douglas
3 changed files
--- a/bitsandbytes/backends/default/ops.py
+++ b/bitsandbytes/backends/default/ops.py
@@ -320,6 +320,7 @@ name2optimizer_id = {
    "ademamix": ADEMAMIX,
 }
 @torch.compile
 def _optimizer_precondition_32bit(
    g: torch.Tensor,
@@ -525,29 +526,53 @@ def _(
    if optimizer_name == "lion":
        _optimizer_update_32bit(
-            g, p, state1, state2, unorm_vec, max_unorm, param_norm,
+            g,
-            beta1, beta2, beta3, alpha, eps, weight_decay, step,
+            p,
-            lr, gnorm_scale, optimizer_id
+            state1,
+            state2,
+            unorm_vec,
+            max_unorm,
+            param_norm,
+            beta1,
+            beta2,
+            beta3,
+            alpha,
+            eps,
+            weight_decay,
+            step,
+            lr,
+            gnorm_scale,
+            optimizer_id,
        )
        if max_unorm > 0.0:
            unorm_vec.zero_()
            _optimizer_precondition_32bit(
-                g, p, state1, state2, unorm_vec,
+                g, p, state1, state2, unorm_vec, beta1, beta2, eps, weight_decay, step, lr, gnorm_scale, optimizer_id
-                beta1, beta2, eps, weight_decay, step,
-                lr, gnorm_scale, optimizer_id
            )
    else:
        if max_unorm > 0.0:
            unorm_vec.zero_()
            _optimizer_precondition_32bit(
-                g, p, state1, state2, unorm_vec,
+                g, p, state1, state2, unorm_vec, beta1, beta2, eps, weight_decay, step, lr, gnorm_scale, optimizer_id
-                beta1, beta2, eps, weight_decay, step,
-                lr, gnorm_scale, optimizer_id
            )
        _optimizer_update_32bit(
-            g, p, state1, state2, unorm_vec, max_unorm, param_norm,
+            g,
-            beta1, beta2, beta3, alpha, eps, weight_decay, step,
+            p,
-            lr, gnorm_scale, optimizer_id
+            state1,
+            state2,
+            unorm_vec,
+            max_unorm,
+            param_norm,
+            beta1,
+            beta2,
+            beta3,
+            alpha,
+            eps,
+            weight_decay,
+            step,
+            lr,
+            gnorm_scale,
+            optimizer_id,
        )
--- a/bitsandbytes/backends/triton/kernels_optim.py
+++ b/bitsandbytes/backends/triton/kernels_optim.py
@@ -4,6 +4,7 @@ import torch
 import triton
 import triton.language as tl
 # from triton.language.extra import libdevice
 MOMENTUM = 0
@@ -23,6 +24,7 @@ name2optimizer_id = {
    "ademamix": ADEMAMIX,
 }
 @triton.jit
 def _optimizer_precondition_2state_32bit(
    g_ptr,
@@ -367,34 +369,104 @@ def optimizer_update_32bit_impl(
    if optimizer_name == "lion":
        fn_update[grid](
-            g, p, state1, state2, unorm_vec, max_unorm, param_norm,
+            g,
-            beta1, beta2, beta3, alpha, eps, weight_decay, step,
+            p,
-            beta1_step, beta2_step, lr, gnorm_scale, skip_zeros,
+            state1,
-            p.numel(), optimizer_id, BLOCK_SIZE, N_PER_TH, num_warps=2,
+            state2,
+            unorm_vec,
+            max_unorm,
+            param_norm,
+            beta1,
+            beta2,
+            beta3,
+            alpha,
+            eps,
+            weight_decay,
+            step,
+            beta1_step,
+            beta2_step,
+            lr,
+            gnorm_scale,
+            skip_zeros,
+            p.numel(),
+            optimizer_id,
+            BLOCK_SIZE,
+            N_PER_TH,
+            num_warps=2,
        )
        if max_unorm > 0.0:
            unorm_vec.zero_()
            fn_preprocess[grid](
-                g, p, state1, state2, unorm_vec,
+                g,
-                beta1, beta2, eps, weight_decay, step, 
+                p,
-                beta1_step, beta2_step, lr, gnorm_scale,
+                state1,
-                p.numel(), optimizer_id, BLOCK_SIZE, N_PER_TH, num_warps=2,
+                state2,
+                unorm_vec,
+                beta1,
+                beta2,
+                eps,
+                weight_decay,
+                step,
+                beta1_step,
+                beta2_step,
+                lr,
+                gnorm_scale,
+                p.numel(),
+                optimizer_id,
+                BLOCK_SIZE,
+                N_PER_TH,
+                num_warps=2,
            )
    else:
        if max_unorm > 0.0:
            unorm_vec.zero_()
            fn_preprocess[grid](
-                g, p, state1, state2, unorm_vec,
+                g,
-                beta1, beta2, eps, weight_decay, step, 
+                p,
-                beta1_step, beta2_step, lr, gnorm_scale,
+                state1,
-                p.numel(), optimizer_id, BLOCK_SIZE, N_PER_TH, num_warps=2,
+                state2,
+                unorm_vec,
+                beta1,
+                beta2,
+                eps,
+                weight_decay,
+                step,
+                beta1_step,
+                beta2_step,
+                lr,
+                gnorm_scale,
+                p.numel(),
+                optimizer_id,
+                BLOCK_SIZE,
+                N_PER_TH,
+                num_warps=2,
            )
        fn_update[grid](
-            g, p, state1, state2, unorm_vec, max_unorm, param_norm,
+            g,
-            beta1, beta2, beta3, alpha, eps, weight_decay, step,
+            p,
-            beta1_step, beta2_step, lr, gnorm_scale, skip_zeros,
+            state1,
-            p.numel(), optimizer_id, BLOCK_SIZE, N_PER_TH, num_warps=2,
+            state2,
+            unorm_vec,
+            max_unorm,
+            param_norm,
+            beta1,
+            beta2,
+            beta3,
+            alpha,
+            eps,
+            weight_decay,
+            step,
+            beta1_step,
+            beta2_step,
+            lr,
+            gnorm_scale,
+            skip_zeros,
+            p.numel(),
+            optimizer_id,
+            BLOCK_SIZE,
+            N_PER_TH,
+            num_warps=2,
        )
--- a/bitsandbytes/backends/triton/ops.py
+++ b/bitsandbytes/backends/triton/ops.py
@@ -3,7 +3,7 @@ from typing import Optional
 import torch
-from . import triton_kernels, kernels_optim
+from . import kernels_optim, triton_kernels
 # currently codes unused, kept for reference
 # Should be the same for quant/dequant