Fix w8a8_int8 model shared experts fusion load weights error (#5120)

1b1b47a9 · lambert0312 · GitHub · 3c9740d2 · 1b1b47a9
Unverified Commit 1b1b47a9 authored Apr 12, 2025 by lambert0312 Committed by GitHub Apr 11, 2025
Show whitespace changes
Inline Side-by-side

Showing with 18 additions and 8 deletions

python/sglang/srt/models/deepseek_v2.py python/sglang/srt/models/deepseek_v2.py +18 -8

No files found.
--- a/python/sglang/srt/models/deepseek_v2.py
+++ b/python/sglang/srt/models/deepseek_v2.py
@@ -1480,6 +1480,16 @@ class DeepseekV2ForCausalLM(nn.Module):
        if self.n_share_experts_fusion is not None and self.n_share_experts_fusion > 0:
            weights_list = list(weights)
            weights_dict = dict(weights_list)
+            if self.quant_config.get_name() == "w8a8_int8":
+                suffix_list = [
+                    "down_proj.weight",
+                    "down_proj.weight_scale",
+                    "gate_proj.weight",
+                    "gate_proj.weight_scale",
+                    "up_proj.weight",
+                    "up_proj.weight_scale",
+                ]
+            else:
                suffix_list = [
                    "down_proj.weight",
                    "down_proj.weight_scale_inv",