Fix shared experts fusion error without quantization (#5632)

76d17c7e · lambert0312 · GitHub · 70d040f9 · 76d17c7e
Unverified Commit 76d17c7e authored Apr 23, 2025 by lambert0312 Committed by GitHub Apr 22, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

python/sglang/srt/models/deepseek_v2.py python/sglang/srt/models/deepseek_v2.py +1 -1

No files found.
--- a/python/sglang/srt/models/deepseek_v2.py
+++ b/python/sglang/srt/models/deepseek_v2.py
@@ -1604,7 +1604,7 @@ class DeepseekV2ForCausalLM(nn.Module):
        if self.n_share_experts_fusion > 0:
            weights_list = list(weights)
            weights_dict = dict(weights_list)
-            if self.quant_config.get_name() == "w8a8_int8":
+            if self.quant_config is None or self.quant_config.get_name() == "w8a8_int8":
                suffix_list = [
                    "down_proj.weight",
                    "down_proj.weight_scale",