Fix shared experts fusion + weight requant (#7177)

b57d87c2 · fzyzcjy · GitHub · 98538822 · b57d87c2
Unverified Commit b57d87c2 authored Jun 14, 2025 by fzyzcjy Committed by GitHub Jun 14, 2025
Show whitespace changes
Inline Side-by-side

Showing with 9 additions and 8 deletions

python/sglang/srt/models/deepseek_v2.py python/sglang/srt/models/deepseek_v2.py +9 -8

No files found.
--- a/python/sglang/srt/models/deepseek_v2.py
+++ b/python/sglang/srt/models/deepseek_v2.py
@@ -1960,7 +1960,8 @@ class DeepseekV2ForCausalLM(nn.Module):
                )
            if layer_id in moe_layers:
-                shared_experts = layer.mlp.shared_experts
+                shared_experts = getattr(layer.mlp, "shared_experts", None)
+                if shared_experts is not None:
                    for module in [
                        shared_experts.gate_up_proj,
                        shared_experts.down_proj,