Also /chat/completions

05ad2884 · lazymio · bf36547f · 05ad2884 · 05ad2884
Unverified Commit 05ad2884 authored Feb 24, 2025 by lazymio
Showing with 5 additions and 2 deletions

ktransformers/server/api/openai/endpoints/chat.py ktransformers/server/api/openai/endpoints/chat.py +2 -2

ktransformers/server/schemas/endpoints/chat.py ktransformers/server/schemas/endpoints/chat.py +3 -0

No files found.
--- a/ktransformers/server/api/openai/endpoints/chat.py
+++ b/ktransformers/server/api/openai/endpoints/chat.py
@@ -28,13 +28,13 @@ async def chat_completion(request:Request,create:ChatCompletionCreate):
    if create.stream:
        async def inner():
            chunk = ChatCompletionChunk(id=id,object='chat.completion.chunk',created=int(time()))
-            async for token in interface.inference(input_message,id):
+            async for token in interface.inference(input_message,id,create.temperature,create.top_p,create.repetition_penalty):
                chunk.set_token(token)
                yield chunk
        return chat_stream_response(request,inner())
    else:
        comp = ChatCompletionObject(id=id,object='chat.completion',created=int(time()))
        comp.usage = Usage(completion_tokens=1, prompt_tokens=1, total_tokens=2)
-        async for token in interface.inference(input_message,id):
+        async for token in interface.inference(input_message,id,create.temperature,create.top_p,create.repetition_penalty):
            comp.append_token(token)
        return comp
--- a/ktransformers/server/schemas/endpoints/chat.py
+++ b/ktransformers/server/schemas/endpoints/chat.py
@@ -25,6 +25,9 @@ class ChatCompletionCreate(BaseModel):
    messages: List[Message]
    model : str
    stream : bool = False
+    temperature: Optional[float]
+    top_p: Optional[float]
+    repetition_penalty: Optional[float]
    def get_tokenizer_messages(self):
        return [m.to_tokenizer_message() for m in self.messages]