[MoE] Move FlashInfer CuteDSL experts into fused_moe/experts/ (#37759)

Signed-off-by: Robert Shaw <robertgshaw2@gmail.com>

[MoE] Move FlashInfer CuteDSL experts into fused_moe/experts/ (#37759)
Signed-off-by: Robert Shaw <robertgshaw2@gmail.com>
6b2fa3a7 · Robert Shaw · GitHub · eeee5b26 · 6b2fa3a7 · 6b2fa3a7
Unverified Commit 6b2fa3a7 authored Mar 21, 2026 by Robert Shaw Committed by GitHub Mar 21, 2026
3 changed files
--- a/tests/kernels/moe/test_cutedsl_moe.py
+++ b/tests/kernels/moe/test_cutedsl_moe.py
@@ -17,7 +17,7 @@ from flashinfer import fp4_quantize
 from torch.nn import functional as F
 from vllm.model_executor.layers.activation import SiluAndMul
-from vllm.model_executor.layers.fused_moe.flashinfer_cutedsl_moe import (
+from vllm.model_executor.layers.fused_moe.experts.flashinfer_cutedsl_moe import (
    flashinfer_cutedsl_moe_masked,
 )
 from vllm.utils.flashinfer import (

--- a/vllm/model_executor/layers/fused_moe/flashinfer_cutedsl_moe.py
+++ b/vllm/model_executor/layers/fused_moe/flashinfer_cutedsl_moe.py
--- a/vllm/model_executor/layers/fused_moe/oracle/nvfp4.py
+++ b/vllm/model_executor/layers/fused_moe/oracle/nvfp4.py
@@ -86,7 +86,7 @@ def backend_to_kernel_cls(
        return [FlashInferExperts]
    elif backend == NvFp4MoeBackend.FLASHINFER_CUTEDSL:
-        from vllm.model_executor.layers.fused_moe.flashinfer_cutedsl_moe import (
+        from vllm.model_executor.layers.fused_moe.experts.flashinfer_cutedsl_moe import (  # noqa: E501
            FlashInferCuteDSLExperts,
        )