update lmslim import

87d03653 · zhuwenwen · 92160378 · 87d03653 · 87d03653
Commit 87d03653 authored Aug 05, 2025 by zhuwenwen
Showing with 14 additions and 7 deletions

vllm/model_executor/layers/fused_moe/fused_moe.py vllm/model_executor/layers/fused_moe/fused_moe.py +8 -5

vllm/model_executor/layers/fused_moe/utils.py vllm/model_executor/layers/fused_moe/utils.py +6 -2

No files found.
--- a/vllm/model_executor/layers/fused_moe/fused_moe.py
+++ b/vllm/model_executor/layers/fused_moe/fused_moe.py
@@ -25,10 +25,13 @@ from vllm.model_executor.layers.fused_moe.deep_gemm_moe import (
 from vllm.model_executor.layers.fused_moe.moe_align_block_size import (
    moe_align_block_size)
-from lmslim.layers.gemm.int8_utils import (
+try:
+    from lmslim.layers.gemm.int8_utils import (
    per_token_group_quant_int8, per_token_quant_int8)
-from lmslim.layers.fused_moe.fuse_moe_int8 import (fused_experts_impl_int8, get_w8a8moe_json)
+    from lmslim.layers.fused_moe.fuse_moe_int8 import (fused_experts_impl_int8, get_w8a8moe_json)
-from lmslim.layers.fused_moe.fuse_moe_w4a8 import fused_experts_impl_w4a8
+    from lmslim.layers.fused_moe.fuse_moe_w4a8 import fused_experts_impl_w4a8
+except Exception:
+    print("INFO: Please install lmslim if you want to infer the quantitative model of moe.\n") 
 from vllm.model_executor.layers.fused_moe.prepare_finalize import (

--- a/vllm/model_executor/layers/fused_moe/utils.py
+++ b/vllm/model_executor/layers/fused_moe/utils.py
@@ -8,8 +8,12 @@ import torch
 from vllm import _custom_ops as ops
 from vllm.model_executor.layers.quantization.utils.fp8_utils import (
    per_token_group_quant_fp8)
-from lmslim.layers.gemm.int8_utils import (
+try:
+    from lmslim.layers.gemm.int8_utils import (
        per_token_group_quant_int8, per_token_quant_int8)
+except Exception:
+    print("INFO: Please install lmslim if you want to use int utils.\n") 
 from vllm.model_executor.layers.quantization.utils.mxfp4_utils import (
    quant_dequant_mxfp4)
 from vllm.platforms import current_platform