Fix variables

6534f5e6 · Casper Hansen · 5db43a7f · 6534f5e6 · 6534f5e6
Commit 6534f5e6 authored Sep 08, 2023 by Casper Hansen
Hide whitespace changes
Inline Side-by-side

Showing with 2 additions and 2 deletions

awq/quantize/auto_clip.py awq/quantize/auto_clip.py +1 -1

awq/quantize/auto_scale.py awq/quantize/auto_scale.py +1 -1

No files found.
--- a/awq/quantize/auto_clip.py
+++ b/awq/quantize/auto_clip.py
@@ -43,7 +43,7 @@ def auto_clip_layer(w,
            max_val = org_max_val * (1 - i_s / n_grid)
            min_val = - max_val
            cur_w = torch.clamp(w, min_val, max_val)
-            q_w = pseudo_quantize_tensor(cur_w, **quant_config)
+            q_w = pseudo_quantize_tensor(cur_w, w_bit=quant_config["w_bit"], q_group_size=quant_config["q_group_size"])
            cur_out = (input_feat * q_w).sum(dim=-1)

            # co, 1, n_group, 1

--- a/awq/quantize/auto_scale.py
+++ b/awq/quantize/auto_scale.py
@@ -98,7 +98,7 @@ def auto_scale_block(awq_model,
    from .quantizer import pseudo_quantize_tensor
    # firstly, get the weight quantize function
    if quant_config['w_bit'] is not None:
-        def w_quantize_func(p): return pseudo_quantize_tensor(p, **quant_config).detach()
+        def w_quantize_func(p): return pseudo_quantize_tensor(p, w_bit=quant_config["w_bit"], q_group_size=quant_config["q_group_size"]).detach()
    else:
        def w_quantize_func(p): return p