Simplify two ipex conditions (#2755)

b4ec427a · Daniël de Kok · GitHub · 38cff84a · b4ec427a · b4ec427a
Unverified Commit b4ec427a authored Nov 19, 2024 by Daniël de Kok Committed by GitHub Nov 19, 2024
2 changed files
--- a/server/text_generation_server/layers/moe/unquantized.py
+++ b/server/text_generation_server/layers/moe/unquantized.py
@@ -8,10 +8,10 @@ from text_generation_server.utils.weights import UnquantizedWeight, Weights
 if SYSTEM == "rocm":
    from vllm.model_executor.layers.fused_moe import fused_moe
-elif SYSTEM != "ipex":
+elif SYSTEM == "ipex":
-    from moe_kernels.fused_moe import fused_moe
-else:
    from intel_extension_for_pytorch.llm.modules import GatedMLPMOE
+else:
+    from moe_kernels.fused_moe import fused_moe
 class UnquantizedSparseMoELayer(nn.Module):

--- a/server/text_generation_server/models/custom_modeling/flash_dbrx_modeling.py
+++ b/server/text_generation_server/models/custom_modeling/flash_dbrx_modeling.py
@@ -25,10 +25,10 @@ from text_generation_server.utils.import_utils import SYSTEM
 if SYSTEM == "rocm":
    from vllm.model_executor.layers.fused_moe import fused_moe
-elif SYSTEM != "ipex":
+elif SYSTEM == "ipex":
-    from moe_kernels.fused_moe import fused_moe
-else:
    from intel_extension_for_pytorch.llm.modules import GatedMLPMOE
+else:
+    from moe_kernels.fused_moe import fused_moe
 from text_generation_server.layers.attention import (
    paged_attention,