Fix AttributeError in Qwen3.5 GDN layers with quantized models (#37448)

Signed-off-by: Jim Smith <jim@joshua8.ai> Signed-off-by: mgoin <mgoin64@gmail.com> Signed-off-by: Michael Goin <mgoin64@gmail.com> Co-authored-by: mgoin <mgoin64@gmail.com> Co-authored-by: Xin Yang <105740670+xyang16@users.noreply.github.com>

Fix AttributeError in Qwen3.5 GDN layers with quantized models (#37448)
Signed-off-by: Jim Smith <jim@joshua8.ai> Signed-off-by: mgoin <mgoin64@gmail.com> Signed-off-by: Michael Goin <mgoin64@gmail.com> Co-authored-by: mgoin <mgoin64@gmail.com> Co-authored-by: Xin Yang <105740670+xyang16@users.noreply.github.com>
4120a05f · Jim Smith · GitHub · 98ff0429 · 4120a05f · 4120a05f
Unverified Commit 4120a05f authored Mar 19, 2026 by Jim Smith Committed by GitHub Mar 19, 2026
Show whitespace changes
Inline Side-by-side

Showing with 4 additions and 4 deletions

vllm/model_executor/models/qwen3_5.py vllm/model_executor/models/qwen3_5.py +2 -2

vllm/model_executor/models/qwen3_next.py vllm/model_executor/models/qwen3_next.py +2 -2

No files found.
--- a/vllm/model_executor/models/qwen3_5.py
+++ b/vllm/model_executor/models/qwen3_5.py
@@ -182,8 +182,8 @@ class Qwen3_5GatedDeltaNet(Qwen3NextGatedDeltaNet):
        # ============================================================
        mixed_qkvz, ba = torch.ops.vllm.gdn_in_proj(
            hidden_states,
-            self.in_proj_qkvz.weight.shape[0],
-            self.in_proj_ba.weight.shape[0],
+            sum(self.in_proj_qkvz.output_sizes) // self.tp_size,
+            sum(self.in_proj_ba.output_sizes) // self.tp_size,
            self.prefix,
        )
        qkv_size = (self.key_dim * 2 + self.value_dim) // self.tp_size

--- a/vllm/model_executor/models/qwen3_next.py
+++ b/vllm/model_executor/models/qwen3_next.py
@@ -660,8 +660,8 @@ class Qwen3NextGatedDeltaNet(nn.Module, MambaBase):
        # ============================================================
        projected_states_qkvz, projected_states_ba = torch.ops.vllm.gdn_in_proj(
            hidden_states,
-            self.in_proj_qkvz.weight.shape[0],
-            self.in_proj_ba.weight.shape[0],
+            sum(self.in_proj_qkvz.output_sizes) // self.tp_size,
+            sum(self.in_proj_ba.output_sizes) // self.tp_size,
            self.prefix,
        )
        query, key, value, z, b, a = self.fix_query_key_value_ordering(