[BugFix] Fix shared storage connector load kv only load attention layer (#21428)

Signed-off-by: David Chen <530634352@qq.com>

[BugFix] Fix shared storage connector load kv only load attention layer (#21428)
Signed-off-by: David Chen <530634352@qq.com>
97d6c30c · WeiQing Chen · GitHub · a40a8506 · 97d6c30c
Unverified Commit 97d6c30c authored Jul 26, 2025 by WeiQing Chen Committed by GitHub Jul 26, 2025
Show whitespace changes
Inline Side-by-side

Showing with 10 additions and 2 deletions

vllm/distributed/kv_transfer/kv_connector/v1/shared_storage_connector.py ...d/kv_transfer/kv_connector/v1/shared_storage_connector.py +10 -2

No files found.
--- a/vllm/distributed/kv_transfer/kv_connector/v1/shared_storage_connector.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/shared_storage_connector.py
@@ -156,8 +156,16 @@ class SharedStorageConnector(KVConnectorBase_V1):
            logger.info("Inject KV cache of %d tokens to the paged memory",
                        len(request.slot_mapping))
            for layer_name in forward_context.no_compile_layers:
-                attn_layer = forward_context.no_compile_layers[layer_name]
+                layer = forward_context.no_compile_layers[layer_name]
-                kv_cache_layer = attn_layer.kv_cache[\
+                # Only process layers that have kv_cache
+                # attribute (attention layers) Skip non-attention
+                # layers like FusedMoE/MLP etc.
+                kv_cache_attr = getattr(layer, 'kv_cache', None)
+                if kv_cache_attr is None:
+                    continue
+                kv_cache_layer = kv_cache_attr[ \
                        forward_context.virtual_engine]
                filename = self._generate_filename_debug(