[Bugfix] Fix broken CPU compressed-tensors test (#11338)

Signed-off-by: Isotr0py <2037008807@qq.com>

[Bugfix] Fix broken CPU compressed-tensors test (#11338)
Signed-off-by: Isotr0py <2037008807@qq.com>
276738ce · Isotr0py · GitHub · cdf22afd · 276738ce
Unverified Commit 276738ce authored Dec 20, 2024 by Isotr0py Committed by GitHub Dec 19, 2024
Hide whitespace changes
Inline Side-by-side

Showing with 2 additions and 4 deletions

vllm/model_executor/layers/quantization/utils/w8a8_utils.py vllm/model_executor/layers/quantization/utils/w8a8_utils.py +2 -4

No files found.
--- a/vllm/model_executor/layers/quantization/utils/w8a8_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/w8a8_utils.py
@@ -11,8 +11,7 @@ TORCH_DEVICE_IDENTITY = torch.ones(1, dtype=torch.float32)


 def sparse_cutlass_supported() -> bool:
-    # sparse cutlass is not supported on Rocm
-    if current_platform.is_rocm():
+    if not current_platform.is_cuda():
        return False

    capability_tuple = current_platform.get_device_capability()
@@ -22,8 +21,7 @@ def sparse_cutlass_supported() -> bool:


 def cutlass_fp8_supported() -> bool:
-    # cutlass is not supported on Rocm
-    if current_platform.is_rocm():
+    if not current_platform.is_cuda():
        return False

    capability_tuple = current_platform.get_device_capability()