Speedup shared expert weight construction by avoid cloning (#5188)

5239d795 · fzyzcjy · GitHub · f0815419 · 5239d795
Unverified Commit 5239d795 authored Apr 21, 2025 by fzyzcjy Committed by GitHub Apr 20, 2025
Show whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

python/sglang/srt/models/deepseek_v2.py python/sglang/srt/models/deepseek_v2.py +1 -1

No files found.
--- a/python/sglang/srt/models/deepseek_v2.py
+++ b/python/sglang/srt/models/deepseek_v2.py
@@ -1628,7 +1628,7 @@ class DeepseekV2ForCausalLM(nn.Module):
                                f"mlp.experts."
                                f"{self.config.n_routed_experts + num_repeat}"
                                f".{suffix}",
-                                weights_dict[shared_expert_weight_name].clone(),
+                                weights_dict[shared_expert_weight_name],
                            )
                        )
                        names_to_remove += [shared_expert_weight_name]