fix qwen3-next run error

440222e9 · zhuwenwen · b8f555af · 440222e9
Commit 440222e9 authored Feb 10, 2026 by zhuwenwen
Hide whitespace changes
Inline Side-by-side

Showing with 0 additions and 2 deletions

vllm/model_executor/layers/fused_moe/unquantized_fused_moe_method.py ...executor/layers/fused_moe/unquantized_fused_moe_method.py +0 -2

No files found.
--- a/vllm/model_executor/layers/fused_moe/unquantized_fused_moe_method.py
+++ b/vllm/model_executor/layers/fused_moe/unquantized_fused_moe_method.py
@@ -289,7 +289,6 @@ class UnquantizedFusedMoEMethod(FusedMoEMethodBase, CustomOp):
        topk_weights: torch.Tensor,
        topk_ids: torch.Tensor,
        use_nn_moe: bool | None = False,
-        use_fused_gate: bool | None = False,
    ) -> torch.Tensor | tuple[torch.Tensor, torch.Tensor]:
        return self.forward(
            layer=layer,
@@ -297,7 +296,6 @@ class UnquantizedFusedMoEMethod(FusedMoEMethodBase, CustomOp):
            topk_weights=topk_weights,
            topk_ids=topk_ids,
            use_nn_moe=use_nn_moe,
-            use_fused_gate=use_fused_gate,
        )
    def get_fused_moe_quant_config(self, layer: torch.nn.Module) -> FusedMoEQuantConfig: