[BUGFIX] 修复 Qwen3.5 在新版 transformers 下的配置兼容问题并统一 ROCm unified attention 路由
目的: 修复 Qwen3.5 / Qwen3.5-MoE 在升级 transformers 后的配置解析兼容问题,并优化 ROCm 下 unified attention 的路由策略,避免prefill 和 decode落到不同实现路径上,降低后续排查和行为不一致的成本
Showing
Please register or sign in to comment