Fix shared experts fusion + weight requant (#7177)

b57d87c2 · fzyzcjy · GitHub · 98538822 · b57d87c2
Unverified Commit b57d87c2 authored Jun 14, 2025 by fzyzcjy Committed by GitHub Jun 14, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 9 additions and 8 deletions

python/sglang/srt/models/deepseek_v2.py python/sglang/srt/models/deepseek_v2.py +9 -8

No files found.
--- a/python/sglang/srt/models/deepseek_v2.py
+++ b/python/sglang/srt/models/deepseek_v2.py
@@ -1960,14 +1960,15 @@ class DeepseekV2ForCausalLM(nn.Module):
                )
            if layer_id in moe_layers:
-                shared_experts = layer.mlp.shared_experts
+                shared_experts = getattr(layer.mlp, "shared_experts", None)
-                for module in [
+                if shared_experts is not None:
-                    shared_experts.gate_up_proj,
+                    for module in [
-                    shared_experts.down_proj,
+                        shared_experts.gate_up_proj,
-                ]:
+                        shared_experts.down_proj,
-                    requant_weight_ue8m0_inplace(
+                    ]:
-                        module.weight, module.weight_scale_inv, weight_block_size
+                        requant_weight_ue8m0_inplace(
-                    )
+                            module.weight, module.weight_scale_inv, weight_block_size
+                        )
                experts = layer.mlp.experts
                if isinstance(experts, DeepEPMoE):