Default to GEMM

48be2ee2 · Casper Hansen · c58ec73b · 48be2ee2
Commit 48be2ee2 authored Sep 09, 2023 by Casper Hansen
Show whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

examples/basic_quant.py examples/basic_quant.py +1 -1

No files found.
--- a/examples/basic_quant.py
+++ b/examples/basic_quant.py
@@ -3,7 +3,7 @@ from transformers import AutoTokenizer
 model_path = 'lmsys/vicuna-7b-v1.5'
 quant_path = 'vicuna-7b-v1.5-awq'
-quant_config = { "zero_point": True, "q_group_size": 128, "w_bit": 4, "version": "GEMV" }
+quant_config = { "zero_point": True, "q_group_size": 128, "w_bit": 4, "version": "GEMM" }
 # Load model
 model = AutoAWQForCausalLM.from_pretrained(model_path)