fix

8465317a · xuxzh1 · f6ce3afa · 8465317a
Commit 8465317a authored Dec 05, 2024 by xuxzh1 🎱
Show whitespace changes
Inline Side-by-side

Showing with 4 additions and 1 deletion

examples/offline_streaming_inference_chat_demo.py examples/offline_streaming_inference_chat_demo.py +4 -1

No files found.
--- a/examples/offline_streaming_inference_chat_demo.py
+++ b/examples/offline_streaming_inference_chat_demo.py
+
+'''
+python offline_streaming_inference_chat_demo.py --model /models/llama2/Llama-2-7b-chat-hf  --template template_llama_chat.jinja --dtype float16 --enforce-eager -tp 1 
+'''
 from vllm.sampling_params import SamplingParams
 from vllm.engine.async_llm_engine import AsyncEngineArgs, AsyncLLMEngine
 import asyncio
-from vllm.utils import FlexibleArgumentParser
 from transformers import AutoTokenizer
 import logging
 import argparse