Update dateset/alpaca_data_cleaned.json

Deleted offline_inference.py

Update dateset/alpaca_data_cleaned.json
Deleted offline_inference.py
4cfed9e7 · yangql · fb40e100 · 4cfed9e7 · fb40e100
Commit 4cfed9e7 authored Nov 28, 2024 by yangql
Hide whitespace changes
Inline Side-by-side

Showing with 0 additions and 23 deletions

dateset/alpaca_data_cleaned.json dateset/alpaca_data_cleaned.json +0 -0

offline_inference.py offline_inference.py +0 -23

No files found.
--- a/examples/quantization/dataset/alpaca_data_cleaned.json
+++ b/examples/quantization/dataset/alpaca_data_cleaned.json
--- a/offline_inference.py
+++ b/offline_inference.py
-from vllm import LLM, SamplingParams
-
-if __name__ == '__main__':
-    # Sample prompts.
-    prompts = [
-        "Hello, my name is",
-        "The president of the United States is",
-        "The capital of France is",
-        "The future of AI is",
-    ]
-    # Create a sampling params object.
-    sampling_params = SamplingParams(temperature=0.8, top_p=0.95, max_tokens=16)
-
-    # Create an LLM.
-    llm = LLM(model="./Qwen1.5-7B-4bit-gptq-2",tensor_parallel_size=1, dtype="float16",trust_remote_code=True, enforce_eager=True)
-    # Generate texts from the prompts. The output is a list of RequestOutput objects
-    # that contain the prompt, generated text, and other information.
-    outputs = llm.generate(prompts, sampling_params)
-    # Print the outputs.
-    for output in outputs:
-        prompt = output.prompt
-        generated_text = output.outputs[0].text
-        print(f"Prompt: {prompt!r}, Generated text: {generated_text!r}")