[bugfix] Fix example/tensorize_vllm_model tests (#10595)

Signed-off-by: Jee Jee Li <pandaleefree@gmail.com>

[bugfix] Fix example/tensorize_vllm_model tests (#10595)
Signed-off-by: Jee Jee Li <pandaleefree@gmail.com>
17d8fc18 · Jee Jee Li · GitHub · 04668ebe · 17d8fc18
Unverified Commit 17d8fc18 authored Nov 24, 2024 by Jee Jee Li Committed by GitHub Nov 23, 2024
Show whitespace changes
Inline Side-by-side

Showing with 3 additions and 1 deletion

vllm/model_executor/model_loader/tensorizer.py vllm/model_executor/model_loader/tensorizer.py +3 -1

No files found.
--- a/vllm/model_executor/model_loader/tensorizer.py
+++ b/vllm/model_executor/model_loader/tensorizer.py
@@ -19,6 +19,7 @@ from vllm.engine.llm_engine import LLMEngine
 from vllm.logger import init_logger
 from vllm.model_executor.layers.vocab_parallel_embedding import (
    VocabParallelEmbedding)
+from vllm.plugins import set_current_vllm_config
 from vllm.utils import FlexibleArgumentParser
 tensorizer_error_msg = None
@@ -284,7 +285,8 @@ class TensorizerAgent:
        model_args = self.tensorizer_config.hf_config
        model_args.torch_dtype = self.tensorizer_config.dtype
        assert self.tensorizer_config.model_class is not None
-        with no_init_or_tensor():
+        # TODO: Do we need to consider old-style model class?
+        with no_init_or_tensor(), set_current_vllm_config(self.vllm_config):
            return self.tensorizer_config.model_class(
                vllm_config=self.vllm_config, )