"benchmarks/kernels/benchmark_trtllm_decode_attention.py" did not exist on "8020e98c9f033e76c97eb8261f772d59eba49c9a"
-
zhuwenwen authored
实现了用于优化张量计算的 rms_mrope_fuse 和 rms_mrope_fuse_fake 方法 更新了 forward:在满足条件时走新的 M-RoPE 融合路径 增强了 Qwen3MoeModel 对动态参数维度的支持,以适配该功能
874d2aaa