skip silu_and_mul_quant

33650733 · zhuwenwen · d2b52805 · 33650733
Commit 33650733 authored Sep 07, 2025 by zhuwenwen
Hide whitespace changes
Inline Side-by-side

Showing with 8 additions and 8 deletions

vllm/compilation/activation_quant_fusion.py vllm/compilation/activation_quant_fusion.py +8 -8

No files found.
--- a/vllm/compilation/activation_quant_fusion.py
+++ b/vllm/compilation/activation_quant_fusion.py
@@ -26,14 +26,14 @@ FP4_DTYPE = torch.uint8
 SILU_MUL_OP = torch.ops._C.silu_and_mul.default
-FUSED_OPS: dict[QuantKey, OpOverload] = {
+# FUSED_OPS: dict[QuantKey, OpOverload] = {
-    kFp8StaticTensorSym: torch.ops._C.silu_and_mul_quant.default,  # noqa: E501
+#     kFp8StaticTensorSym: torch.ops._C.silu_and_mul_quant.default,  # noqa: E501
-}
+# }
-silu_and_mul_nvfp4_quant_supported = (current_platform.is_cuda() and hasattr(
+# silu_and_mul_nvfp4_quant_supported = (current_platform.is_cuda() and hasattr(
-    torch.ops._C, "silu_and_mul_nvfp4_quant"))
+#     torch.ops._C, "silu_and_mul_nvfp4_quant"))
-if silu_and_mul_nvfp4_quant_supported:
+# if silu_and_mul_nvfp4_quant_supported:
-    FUSED_OPS[
+#     FUSED_OPS[
-        kNvfp4Quant] = torch.ops._C.silu_and_mul_nvfp4_quant.default  # noqa: E501
+#         kNvfp4Quant] = torch.ops._C.silu_and_mul_nvfp4_quant.default  # noqa: E501
 class ActivationQuantPattern(ABC):