[Doc] Fix prompt embedding examples (#18350)

Signed-off-by: wangli <wangli858794774@gmail.com>

[Doc] Fix prompt embedding examples (#18350)
Signed-off-by: wangli <wangli858794774@gmail.com>
c5bb0ebd · Li Wang · GitHub · d637b960 · c5bb0ebd
Unverified Commit c5bb0ebd authored May 19, 2025 by Li Wang Committed by GitHub May 19, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 2 additions and 0 deletions

docs/source/serving/prompt_embeds.md docs/source/serving/prompt_embeds.md +2 -0

No files found.
--- a/docs/source/serving/prompt_embeds.md
+++ b/docs/source/serving/prompt_embeds.md
@@ -36,6 +36,7 @@ llm = LLM(model=model_name, enable_prompt_embeds=True)
 chat = [{"role": "user", "content": "Please tell me about the capital of France."}]
 token_ids = tokenizer.apply_chat_template(chat, add_generation_prompt=True, return_tensors='pt')
+embedding_layer = transformers_model.get_input_embeddings()
 prompt_embeds = embedding_layer(token_ids).squeeze(0)
 # Single prompt inference
@@ -116,6 +117,7 @@ transformers_model = transformers.AutoModelForCausalLM.from_pretrained(model_nam
 chat = [{"role": "user", "content": "Please tell me about the capital of France."}]
 token_ids = tokenizer.apply_chat_template(chat, add_generation_prompt=True, return_tensors='pt')
+embedding_layer = transformers_model.get_input_embeddings()
 prompt_embeds = embedding_layer(token_ids).squeeze(0)
 # Prompt embeddings