-
zhuwenwen authored
- 在环境变量中引入 `VLLM_SCHED_ENABLE_MINIMAL_INJECTION` 以控制流水线并行调度的最小注入。 - 调整 Scheduler 逻辑以使用新的最小注入功能。 - 更新调度逻辑以利用输出占位符,确保在解码过程中避免 0-token 停滞。 - 增强 Scheduler,根据批次队列状态管理最小进度注入。
613edd7d
- 在环境变量中引入 `VLLM_SCHED_ENABLE_MINIMAL_INJECTION` 以控制流水线并行调度的最小注入。 - 调整 Scheduler 逻辑以使用新的最小注入功能。 - 更新调度逻辑以利用输出占位符,确保在解码过程中避免 0-token 停滞。 - 增强 Scheduler,根据批次队列状态管理最小进度注入。