feat(moe): 增加 Qwen3 路由 logits 的环境变量可控采集能力
新增 router_capture 工具,用于按 num_tokens/rank 过滤并落盘 MoE router logits 在 Qwen3MoeSparseMoeBlock 中接入采集调用,并在 torch.compile 场景下自动跳过 补充 VLLM_MOE_ROUTER_CAPTURE* 环境变量
Showing
Please register or sign in to comment