-
laibao authored
目的: 修复 Qwen3.5 / Qwen3.5-MoE 在升级 transformers 后的配置解析兼容问题,并优化 ROCm 下 unified attention 的路由策略,避免prefill 和 decode落到不同实现路径上,降低后续排查和行为不一致的成本
624eab7c
目的: 修复 Qwen3.5 / Qwen3.5-MoE 在升级 transformers 后的配置解析兼容问题,并优化 ROCm 下 unified attention 的路由策略,避免prefill 和 decode落到不同实现路径上,降低后续排查和行为不一致的成本