fix:将 VLLM_ENABLE_OUTPUT_PLACEHOLDERS 替换为 VLLM_SCHED_ENABLE_MINIMAL_INJECTION,以改进调度逻辑
- 更新环境变量以控制流水线并行调度的最小注入。 - 从 Request 类中移除 num_output_placeholders,并调整 Scheduler 逻辑以使用新的最小注入功能。 - 增强 Scheduler,根据批次队列状态管理最小进度注入。
Showing
Please register or sign in to comment