Remove unnecessary `torch.full` in DeepSeek (#5601)

71d1785f · fzyzcjy · GitHub · 3f87f831 · 71d1785f
Unverified Commit 71d1785f authored Apr 23, 2025 by fzyzcjy Committed by GitHub Apr 22, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 7 additions and 6 deletions

python/sglang/srt/models/deepseek_v2.py python/sglang/srt/models/deepseek_v2.py +7 -6

No files found.
--- a/python/sglang/srt/models/deepseek_v2.py
+++ b/python/sglang/srt/models/deepseek_v2.py
@@ -323,12 +323,6 @@ class DeepseekV2MoE(nn.Module):
        self, hidden_states: torch.Tensor, forward_mode: ForwardMode
    ) -> torch.Tensor:
        shared_output = None
-        topk_idx = torch.full(
-            (0, self.top_k), -1, dtype=torch.int, device=hidden_states.device
-        )
-        topk_weights = torch.empty(
-            (0, self.top_k), dtype=torch.float32, device=hidden_states.device
-        )
        if (
            forward_mode is not None
            and not forward_mode.is_idle()
@@ -348,6 +342,13 @@ class DeepseekV2MoE(nn.Module):
                correction_bias=self.correction_bias,
                routed_scaling_factor=self.routed_scaling_factor,
            )
+        else:
+            topk_idx = torch.full(
+                (0, self.top_k), -1, dtype=torch.int, device=hidden_states.device
+            )
+            topk_weights = torch.empty(
+                (0, self.top_k), dtype=torch.float32, device=hidden_states.device
+            )
        if self.ep_size > 1:
            # TODO(ch-wan): allow users to set num_max_dispatch_tokens_per_rank value
            (