Set the batch_size

fdff74d6 · Casper Hansen · 6e0bde15 · fdff74d6
Commit fdff74d6 authored Sep 13, 2023 by Casper Hansen
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

examples/benchmark.py examples/benchmark.py +1 -1

No files found.
--- a/examples/benchmark.py
+++ b/examples/benchmark.py
@@ -43,7 +43,7 @@ def run_round(model_path, quant_file, n_generate, input_ids, batch_size):
    print(f" -- Loading model...")
    model = AutoAWQForCausalLM.from_quantized(
        model_path, quant_file, fuse_layers=True,
-        max_new_tokens=n_generate
+        max_new_tokens=n_generate, batch_size=batch_size
    )

    print(f" -- Warming up...")