Fix missing a2a backend init of GLM4.5 MoE Block (#11692)

Signed-off-by: Shangming Cai <csmthu@gmail.com>

Fix missing a2a backend init of GLM4.5 MoE Block (#11692)
Signed-off-by: Shangming Cai <csmthu@gmail.com>
476c67d7 · Shangming Cai · GitHub · 3289da5b · 476c67d7
Unverified Commit 476c67d7 authored Oct 16, 2025 by Shangming Cai Committed by GitHub Oct 15, 2025
Show whitespace changes
Inline Side-by-side

Showing with 4 additions and 2 deletions

python/sglang/srt/models/glm4_moe.py python/sglang/srt/models/glm4_moe.py +4 -2

No files found.
--- a/python/sglang/srt/models/glm4_moe.py
+++ b/python/sglang/srt/models/glm4_moe.py
@@ -467,7 +467,7 @@ class Glm4MoeSparseMoeBlock(DeepseekV2MoE):

        self.top_k = config.num_experts_per_tok

-        if get_moe_a2a_backend().is_deepep():
+        if get_moe_a2a_backend().is_deepep() or get_moe_a2a_backend().is_mooncake():
            # TODO: we will support tp < ep in the future
            self.ep_size = get_moe_expert_parallel_world_size()
            self.num_experts = (
@@ -496,7 +496,9 @@ class Glm4MoeSparseMoeBlock(DeepseekV2MoE):
                return_recv_hook=True,
            )

-        self._enable_deepep_moe = get_moe_a2a_backend().is_deepep()
+        self._enable_a2a_moe = (
+            get_moe_a2a_backend().is_deepep() or get_moe_a2a_backend().is_mooncake()
+        )

    def forward_normal_dual_stream(
        self,