• zhuwenwen's avatar
    feat: 添加输出占位符功能以优化调度 · 613edd7d
    zhuwenwen authored
    - 在环境变量中引入 `VLLM_SCHED_ENABLE_MINIMAL_INJECTION` 以控制流水线并行调度的最小注入。
    - 调整 Scheduler 逻辑以使用新的最小注入功能。
    - 更新调度逻辑以利用输出占位符,确保在解码过程中避免 0-token 停滞。
    - 增强 Scheduler,根据批次队列状态管理最小进度注入。
    613edd7d
core.py 43.3 KB