Default to GEMV

331ff953 · Casper Hansen · 6534f5e6 · 331ff953
Commit 331ff953 authored Sep 08, 2023 by Casper Hansen
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

examples/basic_quant.py examples/basic_quant.py +1 -1

No files found.
--- a/examples/basic_quant.py
+++ b/examples/basic_quant.py
@@ -3,7 +3,7 @@ from transformers import AutoTokenizer
 model_path = 'lmsys/vicuna-7b-v1.5'
 quant_path = 'vicuna-7b-v1.5-awq'
-quant_config = { "zero_point": True, "q_group_size": 128, "w_bit": 4 }
+quant_config = { "zero_point": True, "q_group_size": 128, "w_bit": 4, "version": "GEMV" }
 # Load model
 model = AutoAWQForCausalLM.from_pretrained(model_path)