update README.md

ed2965a5 · weishb · 4562f845 · ed2965a5
Commit ed2965a5 authored Mar 02, 2026 by weishb
Show whitespace changes
Inline Side-by-side

Showing with 15 additions and 7 deletions

README.md README.md +15 -7

No files found.
--- a/README.md
+++ b/README.md
@@ -65,14 +65,22 @@ docker run -it \
 ## 推理
 ### vllm
 #### 单机推理
-启动服务
 ```bash
-vllm serve Qwen/Qwen3-VL-Embedding-8B --runner pooling --host 0.0.0.0 --port 8000 --served-model-name qwen3-vl-embedding --max-model-len 8192 --gpu-memory-utilization 0.95
+## serve启动
-```
+vllm serve Qwen/Qwen3-VL-Embedding-8B \
-调用服务：
+    --runner pooling \
-```
+    --host 0.0.0.0 \
-curl -s http://127.0.0.1:8000/v1/embeddings -H "Content-Type: application/json" -d '{"model": "qwen3-vl-embedding","input": "这是一个用于测试 vLLM embedding 服务是否正常的句子。"}'
+    --port 8000 \
+    --served-model-name qwen3-vl-embedding \
+    --max-model-len 8192 \
+    --gpu-memory-utilization 0.95
+## client访问
+curl -s http://127.0.0.1:8000/v1/embeddings \
+    -H "Content-Type: application/json" \ 
+    -d '{"model": "qwen3-vl-embedding",
+        "input": "这是一个用于测试 vLLM embedding 服务是否正常的句子。"
+    }'
 ```