Support oai in benchmark/mmlu (#323)

e2b2f0a2 · Lianmin Zheng · GitHub · b57abe16 · e2b2f0a2 · e2b2f0a2
Unverified Commit e2b2f0a2 authored Mar 22, 2024 by Lianmin Zheng Committed by GitHub Mar 22, 2024
Showing with 15 additions and 5 deletions

benchmark/mmlu/README.md benchmark/mmlu/README.md +4 -0

benchmark/mmlu/bench_sglang.py benchmark/mmlu/bench_sglang.py +10 -4

python/sglang/test/test_utils.py python/sglang/test/test_utils.py +1 -1

No files found.
--- a/benchmark/mmlu/README.md
+++ b/benchmark/mmlu/README.md
@@ -15,6 +15,10 @@ python -m sglang.launch_server --model-path meta-llama/Llama-2-7b-chat-hf --port
 python3 bench_sglang.py --nsub 10
 ```
+```
+# OpenAI models
+python3 bench_sglang.py --backend gpt-3.5-turbo --parallel 8
+```
 ### Benchmark vllm
 ```

--- a/benchmark/mmlu/bench_sglang.py
+++ b/benchmark/mmlu/bench_sglang.py
@@ -64,10 +64,16 @@ def evaluate(args, subject, dev_df, test_df):
    #####################################
    import sglang as sgl
-    @sgl.function
+    if args.backend.startswith("gpt-"):
-    def few_shot_mmlu(s, examples, question):
+        @sgl.function
-        s += examples + question + sgl.gen("answer")
+        def few_shot_mmlu(s, examples, question):
+            s += sgl.user(examples + question)
+            s += sgl.assistant(sgl.gen("answer"))
+    else:
+        @sgl.function
+        def few_shot_mmlu(s, examples, question):
+            s += examples + question + sgl.gen("answer")
    #####################################
    ########## SGL Program End ##########

--- a/python/sglang/test/test_utils.py
+++ b/python/sglang/test/test_utils.py
@@ -155,7 +155,7 @@ def select_sglang_backend(args):
            global_config.enable_parallel_decoding = False
            global_config.enable_parallel_encoding = False
        backend = RuntimeEndpoint(f"{args.host}:{args.port}")
-    elif args.backend.startswith("gpt"):
+    elif args.backend.startswith("gpt-"):
        backend = OpenAI(args.backend)
    else:
        raise ValueError(f"Invalid backend: {args.backend}")