为 Qwen3 和 Qwen3Moe 增加可选的 fused QKV split + RMSNorm + RoPE 执行路径, 减少中间张量拆分与重复计算开销,统一相关模型的优化开关控制逻辑。
Attach a file by drag & drop or click to upload