[EASY] Drop duplicate KV-cache initialization (#38799)

Signed-off-by: namgyu-youn <namgyu.dev@gmail.com>

[EASY] Drop duplicate KV-cache initialization (#38799)
Signed-off-by: namgyu-youn <namgyu.dev@gmail.com>
94fbb098 · namgyu-youn · GitHub · 419e73cd · 94fbb098
Unverified Commit 94fbb098 authored Apr 07, 2026 by namgyu-youn Committed by GitHub Apr 06, 2026
Show whitespace changes
Inline Side-by-side

Showing with 0 additions and 3 deletions

vllm/model_executor/layers/attention/attention.py vllm/model_executor/layers/attention/attention.py +0 -3

No files found.
--- a/vllm/model_executor/layers/attention/attention.py
+++ b/vllm/model_executor/layers/attention/attention.py
@@ -131,9 +131,6 @@ def _init_kv_cache_quant(
        quant_config: Optional quantization configuration.
        prefix: Layer name prefix for quantization method lookup.
    """
-    quant_method = (
-        quant_config.get_quant_method(layer, prefix=prefix) if quant_config else None
-    )

    # Note [Register q/k/v/prob scales in state dict]
    # When calling model.to(device), only parameters/buffers in state dict are