[Bugfix] Fix activation quantization for compressed-tensors W4A16 (#31572)

Signed-off-by: Tmn07 <tmn0796@gmail.com>

[Bugfix] Fix activation quantization for compressed-tensors W4A16 (#31572)
Signed-off-by: Tmn07 <tmn0796@gmail.com>
ca179d0f · Tmn07 · GitHub · 013b5408 · ca179d0f
Unverified Commit ca179d0f authored Jan 02, 2026 by Tmn07 Committed by GitHub Jan 01, 2026
Show whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_wNa16.py ...on/compressed_tensors/schemes/compressed_tensors_wNa16.py +1 -1

No files found.
--- a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_wNa16.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_wNa16.py
@@ -114,7 +114,7 @@ class CompressedTensorsWNA16(CompressedTensorsScheme):
            logger.info("Using %s for CompressedTensorsWNA16", kernel_type.__name__)
            self._kernel_backends_being_used.add(kernel_type.__name__)

-        if isinstance(kernel_type, MarlinLinearKernel):
+        if kernel_type is MarlinLinearKernel:
            input_dtype = get_marlin_input_dtype(self.layer_name)
            if input_dtype is not None:
                mp_linear_kernel_config.act_type = input_dtype