Fix bug

8f65b603 · Rayyyyy · bb0a99c2 · 8f65b603
Commit 8f65b603 authored Aug 01, 2024 by Rayyyyy
Show whitespace changes
Inline Side-by-side

Showing with 5 additions and 6 deletions

llm_service/inferencer.py llm_service/inferencer.py +5 -6

No files found.
--- a/llm_service/inferencer.py
+++ b/llm_service/inferencer.py
@@ -206,16 +206,15 @@ def llm_inference(args):
    logger.info(f"Get params: model_path {model_path}, use_vllm {use_vllm}, tensor_parallel_size {tensor_parallel_size}, stream_chat {stream_chat}")

    model, tokenzier, sampling_params = init_model(model_path, use_vllm, tensor_parallel_size)
+
+    async def inference(request):
+        start = time.time()
+        input_json = await request.json()
        llm_infer = LLMInference(model,
                                tokenzier,
                                sampling_params,
                                use_vllm=use_vllm,
                                stream_chat=stream_chat)
-
-    async def inference(request):
-        start = time.time()
-        input_json = await request.json()
-
        prompt = input_json['query']
        history = input_json['history']
        if stream_chat: