Enable request body OpenAPI spec for OpenAI endpoints (#865)

becd7a56 · lplcor · GitHub · 75471386 · becd7a56
Unverified Commit becd7a56 authored Aug 29, 2023 by lplcor Committed by GitHub Aug 29, 2023
Show whitespace changes
Inline Side-by-side

Showing with 3 additions and 4 deletions

vllm/entrypoints/openai/api_server.py vllm/entrypoints/openai/api_server.py +3 -4

No files found.
--- a/vllm/entrypoints/openai/api_server.py
+++ b/vllm/entrypoints/openai/api_server.py
@@ -178,7 +178,8 @@ def create_logprobs(token_ids: List[int],
 @app.post("/v1/chat/completions")
-async def create_chat_completion(raw_request: Request):
+async def create_chat_completion(request: ChatCompletionRequest,
+                                 raw_request: Request):
    """Completion API similar to OpenAI's API.
    See  https://platform.openai.com/docs/api-reference/chat/create
@@ -188,7 +189,6 @@ async def create_chat_completion(raw_request: Request):
        - function_call (Users should implement this by themselves)
        - logit_bias (to be supported by vLLM engine)
    """
-    request = ChatCompletionRequest(**await raw_request.json())
    logger.info(f"Received chat completion request: {request}")
    error_check_ret = await check_model(request)
@@ -348,7 +348,7 @@ async def create_chat_completion(raw_request: Request):
 @app.post("/v1/completions")
-async def create_completion(raw_request: Request):
+async def create_completion(request: CompletionRequest, raw_request: Request):
    """Completion API similar to OpenAI's API.
    See https://platform.openai.com/docs/api-reference/completions/create
@@ -361,7 +361,6 @@ async def create_completion(raw_request: Request):
          suffix)
        - logit_bias (to be supported by vLLM engine)
    """
-    request = CompletionRequest(**await raw_request.json())
    logger.info(f"Received completion request: {request}")
    error_check_ret = await check_model(request)