MoE 路由抓取:新增 router_capture 工具链与 envs 统一配置
新增环境变量 VLLM_MOE_ROUTER_CAPTURE / DIR / RANK / MAX_LAYERS / NUM_TOKENS_* 用于开关与过滤控制 新增 router_capture.py,支持按 num_tokens 分桶抓取 router logits 并落盘 在 qwen3_moe 中接入抓取逻辑,默认关闭,仅在开启时记录 固定 skip_profile / skip_stack_funcs 为默认启用,避免抓到 warmup/profile 形状 统一配置入口到 vllm.envs,作为运行时基准
Showing
Please register or sign in to comment