[Misc] Support qwen3-next lora (#31719)

96fcd3c2 · BingjiaWang · GitHub · 1f214290 · 96fcd3c2
Unverified Commit 96fcd3c2 authored Jan 08, 2026 by BingjiaWang Committed by GitHub Jan 08, 2026
Show whitespace changes
Inline Side-by-side

Showing with 7 additions and 1 deletion

vllm/model_executor/models/qwen3_next.py vllm/model_executor/models/qwen3_next.py +7 -1

No files found.
--- a/vllm/model_executor/models/qwen3_next.py
+++ b/vllm/model_executor/models/qwen3_next.py
@@ -145,7 +145,13 @@ class Qwen3NextSparseMoeBlock(nn.Module):
            prefix=f"{prefix}.gate",
        )

-        self.shared_expert_gate = torch.nn.Linear(config.hidden_size, 1, bias=False)
+        self.shared_expert_gate = ReplicatedLinear(
+            config.hidden_size,
+            1,
+            bias=False,
+            quant_config=None,
+            prefix=f"{prefix}.shared_expert_gate",
+        )

        if config.shared_expert_intermediate_size > 0:
            self.shared_expert = Qwen3NextMLP(