• laibao's avatar
    [bugfix] 优化 reject-sampling 的 InputBatch 元数据处理 · a0d556fe
    laibao authored
    - 在 InputBatch.refresh_metadata 中为展开后的采样元数据引入 repeat_count 记录重复次数
    - 完善元数据刷新逻辑以适配 reject-sampling 优化路径
    - 更新 GPUModelRunnerBase,在 batch 处理阶段正确消费新的采样元数据与重复计数
    a0d556fe
gpu_model_runner.py 166 KB