[feat] 支持 mRoPE 的 fused RMSNorm+RoPE 路径,并修正 torch.compile 动态维度标注
实现了用于优化张量计算的 rms_mrope_fuse 和 rms_mrope_fuse_fake 方法 更新了 forward:在满足条件时走新的 M-RoPE 融合路径 增强了 Qwen3MoeModel 对动态参数维度的支持,以适配该功能
Showing
Please register or sign in to comment
实现了用于优化张量计算的 rms_mrope_fuse 和 rms_mrope_fuse_fake 方法 更新了 forward:在满足条件时走新的 M-RoPE 融合路径 增强了 Qwen3MoeModel 对动态参数维度的支持,以适配该功能