[BugFix] Pass in correct VLLM config in FlashInfer backend (#13207) (#16973)

Signed-off-by: 苏政渊 <suzhengyuan@moonshot.cn> Co-authored-by: 苏政渊 <suzhengyuan@moonshot.cn>

[BugFix] Pass in correct VLLM config in FlashInfer backend (#13207) (#16973)
Signed-off-by: 苏政渊 <suzhengyuan@moonshot.cn> Co-authored-by: 苏政渊 <suzhengyuan@moonshot.cn>
f961d7f6 · Zhengyuan Su (苏政渊) · GitHub · d0591104 · f961d7f6
Unverified Commit f961d7f6 authored Apr 22, 2025 by Zhengyuan Su (苏政渊) Committed by GitHub Apr 22, 2025
Show whitespace changes
Inline Side-by-side

Showing with 3 additions and 3 deletions

vllm/attention/backends/flashinfer.py vllm/attention/backends/flashinfer.py +3 -3

No files found.
--- a/vllm/attention/backends/flashinfer.py
+++ b/vllm/attention/backends/flashinfer.py
@@ -37,7 +37,7 @@ from vllm.attention.backends.utils import (PAD_SLOT_ID, compute_slot_mapping,
                                           is_block_tables_empty)
 from vllm.attention.layer import Attention
 from vllm.attention.ops.paged_attn import PagedAttention
-from vllm.config import VllmConfig, get_current_vllm_config
+from vllm.config import VllmConfig
 from vllm.logger import init_logger
 from vllm.utils import (async_tensor_h2d, get_kv_cache_torch_dtype,
                        make_tensor_with_pad)
@@ -187,7 +187,7 @@ class FlashInferState(AttentionState):
        # Global hyperparameters shared by all attention layers
        self.global_hyperparameters: Optional[PerLayerParameters] = None
-        self.vllm_config = get_current_vllm_config()
+        self.vllm_config = self.runner.vllm_config
    def _get_workspace_buffer(self):
        if self._workspace_buffer is None:
@@ -613,7 +613,7 @@ class FlashInferMetadataBuilder(AttentionMetadataBuilder[FlashInferMetadata]):
        # Global hyperparameters shared by all attention layers
        self.global_hyperparameters: Optional[PerLayerParameters] = None
-        self.vllm_config = get_current_vllm_config()
+        self.vllm_config = self.runner.vllm_config
    def prepare(self):
        self.slot_mapping: List[int] = []