update moe_sum interface

00bbf0bb · zhuwenwen · 484fcfca · 00bbf0bb
Commit 00bbf0bb authored Sep 29, 2025 by zhuwenwen
Hide whitespace changes
Inline Side-by-side

Showing with 3 additions and 2 deletions

vllm/model_executor/layers/fused_moe/fused_moe.py vllm/model_executor/layers/fused_moe/fused_moe.py +3 -2

No files found.
--- a/vllm/model_executor/layers/fused_moe/fused_moe.py
+++ b/vllm/model_executor/layers/fused_moe/fused_moe.py
@@ -1770,8 +1770,9 @@ def fused_experts_impl(
        if envs.VLLM_USE_LIGHTOP and not dpsk_fp16_quick: 
            from lightop import op as op
-            op.moe_sum(intermediate_cache3.view(*intermediate_cache3.size()),
+            op.moe_sum(input=intermediate_cache3.view(*intermediate_cache3.size()),
-                    out_hidden_states[begin_chunk_idx:end_chunk_idx], shared_output[begin_chunk_idx:end_chunk_idx], None, routed_scaling_factor)
+                    output=out_hidden_states[begin_chunk_idx:end_chunk_idx], bias=shared_output[begin_chunk_idx:end_chunk_idx], 
+                    expert_mask=None, num_local_tokens=None, factor=routed_scaling_factor)
        # else:
        #     ops.moe_sum(intermediate_cache3.view(*intermediate_cache3.size()),
        #                 out_hidden_states[begin_chunk_idx:end_chunk_idx])