Remove max_num_seqs in latency benchmark script (#1855)

51d3cb95 · Woosuk Kwon · GitHub · e74b1736 · 51d3cb95
Unverified Commit 51d3cb95 authored Nov 30, 2023 by Woosuk Kwon Committed by GitHub Nov 30, 2023
Hide whitespace changes
Inline Side-by-side

Showing with 0 additions and 1 deletion

benchmarks/benchmark_latency.py benchmarks/benchmark_latency.py +0 -1

No files found.
--- a/benchmarks/benchmark_latency.py
+++ b/benchmarks/benchmark_latency.py
@@ -19,7 +19,6 @@ def main(args: argparse.Namespace):
        tokenizer=args.tokenizer,
        quantization=args.quantization,
        tensor_parallel_size=args.tensor_parallel_size,
-        max_num_seqs=args.batch_size,
        trust_remote_code=args.trust_remote_code,
        dtype=args.dtype,
    )