[Bug] Fix pooling model benchmark script (#36300)

Signed-off-by: yewentao256 <zhyanwentao@126.com>

[Bug] Fix pooling model benchmark script (#36300)
Signed-off-by: yewentao256 <zhyanwentao@126.com>
be292b7c · Wentao Ye · GitHub · 77a73458 · be292b7c · be292b7c
Unverified Commit be292b7c authored Mar 09, 2026 by Wentao Ye Committed by GitHub Mar 09, 2026
Show whitespace changes
Inline Side-by-side

Showing with 13 additions and 5 deletions

vllm/benchmarks/lib/endpoint_request_func.py vllm/benchmarks/lib/endpoint_request_func.py +11 -0

vllm/benchmarks/serve.py vllm/benchmarks/serve.py +2 -5

No files found.
--- a/vllm/benchmarks/lib/endpoint_request_func.py
+++ b/vllm/benchmarks/lib/endpoint_request_func.py
@@ -795,6 +795,17 @@ ASYNC_REQUEST_FUNCS: dict[str, RequestFunc] = {
    "vllm-rerank": async_request_vllm_rerank,
 }

+POOLING_BACKENDS = {
+    "openai-embeddings",
+    "openai-embeddings-chat",
+    "openai-embeddings-clip",
+    "openai-embeddings-vlm2vec",
+    "infinity-embeddings",
+    "infinity-embeddings-clip",
+    "vllm-pooling",
+    "vllm-rerank",
+}
+
 OPENAI_COMPATIBLE_BACKENDS = [
    k
    for k, v in ASYNC_REQUEST_FUNCS.items()

--- a/vllm/benchmarks/serve.py
+++ b/vllm/benchmarks/serve.py
@@ -45,6 +45,7 @@ from vllm.benchmarks.datasets import SampleRequest, add_dataset_parser, get_samp
 from vllm.benchmarks.lib.endpoint_request_func import (
    ASYNC_REQUEST_FUNCS,
    OPENAI_COMPATIBLE_BACKENDS,
+    POOLING_BACKENDS,
    RequestFuncInput,
    RequestFuncOutput,
 )
@@ -1721,11 +1722,7 @@ async def main_async(args: argparse.Namespace) -> dict[str, Any]:
    goodput_config_dict = check_goodput_args(args)

    backend = args.backend
-    task_type = (
-        TaskType.POOLING
-        if "embeddings" in backend or "rerank" in backend
-        else TaskType.GENERATION
-    )
+    task_type = TaskType.POOLING if backend in POOLING_BACKENDS else TaskType.GENERATION

    # Collect the sampling parameters.
    if task_type == TaskType.GENERATION: