Merge tag 'v0.9.1' into v0.9.1-dev

4c676e3d · zhuwenwen · b4c4464d · b6553be1 · 4c676e3d · 4c676e3d
Commit 4c676e3d authored Jun 20, 2025 by zhuwenwen
20 changed files
--- a/docs/api/README.md
+++ b/docs/api/README.md
+# Summary
+[](){ #configuration }
+## Configuration
+API documentation for vLLM's configuration classes.
+- [vllm.config.ModelConfig][]
+- [vllm.config.CacheConfig][]
+- [vllm.config.TokenizerPoolConfig][]
+- [vllm.config.LoadConfig][]
+- [vllm.config.ParallelConfig][]
+- [vllm.config.SchedulerConfig][]
+- [vllm.config.DeviceConfig][]
+- [vllm.config.SpeculativeConfig][]
+- [vllm.config.LoRAConfig][]
+- [vllm.config.PromptAdapterConfig][]
+- [vllm.config.MultiModalConfig][]
+- [vllm.config.PoolerConfig][]
+- [vllm.config.DecodingConfig][]
+- [vllm.config.ObservabilityConfig][]
+- [vllm.config.KVTransferConfig][]
+- [vllm.config.CompilationConfig][]
+- [vllm.config.VllmConfig][]
+[](){ #offline-inference-api }
+## Offline Inference
+LLM Class.
+- [vllm.LLM][]
+LLM Inputs.
+- [vllm.inputs.PromptType][]
+- [vllm.inputs.TextPrompt][]
+- [vllm.inputs.TokensPrompt][]
+## vLLM Engines
+Engine classes for offline and online inference.
+- [vllm.LLMEngine][]
+- [vllm.AsyncLLMEngine][]
+## Inference Parameters
+Inference parameters for vLLM APIs.
+[](){ #sampling-params }
+[](){ #pooling-params }
+- [vllm.SamplingParams][]
+- [vllm.PoolingParams][]
+[](){ #multi-modality }
+## Multi-Modality
+vLLM provides experimental support for multi-modal models through the [vllm.multimodal][] package.
+Multi-modal inputs can be passed alongside text and token prompts to [supported models][supported-mm-models]
+via the `multi_modal_data` field in [vllm.inputs.PromptType][].
+Looking to add your own multi-modal model? Please follow the instructions listed [here][supports-multimodal].
+- [vllm.multimodal.MULTIMODAL_REGISTRY][]
+### Inputs
+User-facing inputs.
+- [vllm.multimodal.inputs.MultiModalDataDict][]
+Internal data structures.
+- [vllm.multimodal.inputs.PlaceholderRange][]
+- [vllm.multimodal.inputs.NestedTensors][]
+- [vllm.multimodal.inputs.MultiModalFieldElem][]
+- [vllm.multimodal.inputs.MultiModalFieldConfig][]
+- [vllm.multimodal.inputs.MultiModalKwargsItem][]
+- [vllm.multimodal.inputs.MultiModalKwargs][]
+- [vllm.multimodal.inputs.MultiModalInputs][]
+### Data Parsing
+- [vllm.multimodal.parse][]
+### Data Processing
+- [vllm.multimodal.processing][]
+### Memory Profiling
+- [vllm.multimodal.profiling][]
+### Registry
+- [vllm.multimodal.registry][]
+## Model Development
+- [vllm.model_executor.models.interfaces_base][]
+- [vllm.model_executor.models.interfaces][]
+- [vllm.model_executor.models.adapters][]
--- a/docs/api/vllm/.meta.yml
+++ b/docs/api/vllm/.meta.yml
+search:
+  boost: 0.5
--- a/docs/assets/contributing/dockerfile-stages-dependency.png
+++ b/docs/assets/contributing/dockerfile-stages-dependency.png
--- a/docs/source/assets/deployment/anything-llm-chat-with-doc.png
+++ b/docs/source/assets/deployment/anything-llm-chat-with-doc.png
--- a/docs/source/assets/deployment/anything-llm-chat-without-doc.png
+++ b/docs/source/assets/deployment/anything-llm-chat-without-doc.png
--- a/docs/source/assets/deployment/anything-llm-provider.png
+++ b/docs/source/assets/deployment/anything-llm-provider.png
--- a/docs/source/assets/deployment/anything-llm-upload-doc.png
+++ b/docs/source/assets/deployment/anything-llm-upload-doc.png
--- a/docs/source/assets/deployment/architecture_helm_deployment.png
+++ b/docs/source/assets/deployment/architecture_helm_deployment.png
--- a/docs/assets/deployment/chatbox-chat.png
+++ b/docs/assets/deployment/chatbox-chat.png
--- a/docs/assets/deployment/chatbox-settings.png
+++ b/docs/assets/deployment/chatbox-settings.png
--- a/docs/assets/deployment/dify-chat.png
+++ b/docs/assets/deployment/dify-chat.png
--- a/docs/assets/deployment/dify-create-chatbot.png
+++ b/docs/assets/deployment/dify-create-chatbot.png
--- a/docs/assets/deployment/dify-settings.png
+++ b/docs/assets/deployment/dify-settings.png
--- a/docs/source/assets/deployment/open_webui.png
+++ b/docs/source/assets/deployment/open_webui.png
--- a/docs/assets/deployment/streamlit-chat.png
+++ b/docs/assets/deployment/streamlit-chat.png
--- a/docs/source/assets/design/arch_overview/entrypoints.excalidraw.png
+++ b/docs/source/assets/design/arch_overview/entrypoints.excalidraw.png
--- a/docs/source/assets/design/arch_overview/llm_engine.excalidraw.png
+++ b/docs/source/assets/design/arch_overview/llm_engine.excalidraw.png
--- a/docs/source/assets/design/hierarchy.png
+++ b/docs/source/assets/design/hierarchy.png
--- a/docs/source/assets/design/v1/metrics/intervals-1.png
+++ b/docs/source/assets/design/v1/metrics/intervals-1.png
--- a/docs/source/assets/design/v1/metrics/intervals-2.png
+++ b/docs/source/assets/design/v1/metrics/intervals-2.png