• chenyue3's avatar
    fix(qwen3): 在 fused RMS+RoPE 算子内支持非连续输入 · b65d0556
    chenyue3 authored
      - 在 C++ 算子中移除 query/key/residual 的 contiguous 强校验
      - 对非连续输入使用工作张量执行计算(优化路径与 fallback 路径统一)
      - 计算完成后将结果 copy_ 回原张量,保持 in-place 语义
      - 移除 qwen3 / qwen3_moe Python 前向中的 q、k.contiguous() 预处理
    b65d0556
qwen3.py 17.2 KB