Fix variables and no contiguous memory for GEMV

e197a733 · Casper Hansen · 331ff953 · e197a733
Commit e197a733 authored Sep 08, 2023 by Casper Hansen
Hide whitespace changes
Inline Side-by-side

Showing with 4 additions and 4 deletions

awq/models/base.py awq/models/base.py +4 -4

No files found.
--- a/awq/models/base.py
+++ b/awq/models/base.py
@@ -77,13 +77,13 @@ class BaseAWQForCausalLM(nn.Module):
                module.weight.data, scales, zeros = pseudo_quantize_tensor(
                    module.weight.data, 
                    get_scale_zp=True, 
-                    **self.quant_config
+                    w_bit=self.quant_config["w_bit"], 
+                    q_group_size=self.quant_config["q_group_size"]
                )

-                scales = scales.t().contiguous()
-                zeros = zeros.t().contiguous()
-
                if self.quant_config["version"] == 'GEMM':
+                    scales = scales.t().contiguous()
+                    zeros = zeros.t().contiguous()
                    q_linear_module = WQLinear_GEMM
                elif self.quant_config["version"] == 'GEMV':
                    q_linear_module = WQLinear_GEMV