feat(moe):新增 VLLM_USE_MOE_W16A16_TRTION 强制 Triton MoE
增加环境变量开关,禁用 Marlin W16A16 MoE 路径 强制 Triton 且权重已是 Marlin packed 时给出明确报错 Marlin 支持探测改为 best-effort(不再依赖 VLLM_USE_LIGHTOP)
Showing
Please register or sign in to comment
增加环境变量开关,禁用 Marlin W16A16 MoE 路径 强制 Triton 且权重已是 Marlin packed 时给出明确报错 Marlin 支持探测改为 best-effort(不再依赖 VLLM_USE_LIGHTOP)