update fused_moe.py

241ea5cd · zhuwenwen · 1faf662d · 241ea5cd
Commit 241ea5cd authored Oct 02, 2025 by zhuwenwen
Show whitespace changes
Inline Side-by-side

Showing with 2 additions and 0 deletions

vllm/model_executor/layers/fused_moe/fused_moe.py vllm/model_executor/layers/fused_moe/fused_moe.py +2 -0

No files found.
--- a/vllm/model_executor/layers/fused_moe/fused_moe.py
+++ b/vllm/model_executor/layers/fused_moe/fused_moe.py
@@ -1259,6 +1259,7 @@ def inplace_fused_experts(
    block_shape: Optional[List[int]] = None,  #noqa: UP006
    w1_bias: Optional[torch.Tensor] = None,
    w2_bias: Optional[torch.Tensor] = None,
+    use_nn_moe: Optional[bool] = False,
 ) -> None:
    fused_experts_impl(hidden_states, w1, w2, topk_weights, topk_ids, True,
                       activation, apply_router_weight_on_input, use_fp8_w8a8,
@@ -1293,6 +1294,7 @@ def inplace_fused_experts_fake(
    block_shape: Optional[List[int]] = None,  #noqa: UP006
    w1_bias: Optional[torch.Tensor] = None,
    w2_bias: Optional[torch.Tensor] = None,
+    use_nn_moe: Optional[bool] = False,
 ) -> None:
    pass