feat: 为Qwen3 MoE添加RMSNorm和RoPE融合优化与qwen3-480B tp8 moe配置文件
- 新增rms_rotary_embedding_fuse自定义操作 - 添加内核配置文件E=160,N=320 - 通过VLLM_USE_FUSED_RMS_ROPE环境变量控制融合路径
Showing
Please register or sign in to comment
- 新增rms_rotary_embedding_fuse自定义操作 - 添加内核配置文件E=160,N=320 - 通过VLLM_USE_FUSED_RMS_ROPE环境变量控制融合路径