[Quantization] Enable compressed-tensors AWQ for Turing GPU (#29732)

Signed-off-by: Isotr0py <mozf@mail2.sysu.edu.cn>

[Quantization] Enable compressed-tensors AWQ for Turing GPU (#29732)
Signed-off-by: Isotr0py <mozf@mail2.sysu.edu.cn>
e1464c3a · Isotr0py · GitHub · a491b091 · e1464c3a
Unverified Commit e1464c3a authored Nov 30, 2025 by Isotr0py Committed by GitHub Nov 30, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 2 additions and 2 deletions

vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_wNa16.py ...on/compressed_tensors/schemes/compressed_tensors_wNa16.py +2 -2

No files found.
--- a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_wNa16.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_wNa16.py
@@ -79,8 +79,8 @@ class CompressedTensorsWNA16(CompressedTensorsScheme):

    @classmethod
    def get_min_capability(cls) -> int:
-        # ampere and up
-        return 80
+        # Turing and up
+        return 75

    def create_weights(
        self,