[BugFix] Fix Granite model configuration (#8216)

baa54675 · Nick Hill · GitHub · db3bf7c9 · baa54675 · baa54675
Unverified Commit baa54675 authored Sep 05, 2024 by Nick Hill Committed by GitHub Sep 06, 2024
Show whitespace changes
Inline Side-by-side

Showing with 42 additions and 24 deletions

vllm/transformers_utils/config.py vllm/transformers_utils/config.py +38 -24

vllm/transformers_utils/configs/__init__.py vllm/transformers_utils/configs/__init__.py +4 -0

No files found.
--- a/vllm/transformers_utils/config.py
+++ b/vllm/transformers_utils/config.py
@@ -10,12 +10,16 @@ from transformers.models.auto.modeling_auto import (
 from vllm.envs import VLLM_USE_MODELSCOPE
 from vllm.logger import init_logger
+# yapf conflicts with isort for this block
+# yapf: disable
 from vllm.transformers_utils.configs import (ChatGLMConfig, DbrxConfig,
                                             EAGLEConfig, ExaoneConfig,
-                                             InternVLChatConfig, JAISConfig,
+                                             GraniteConfig, InternVLChatConfig,
-                                             MedusaConfig, MLPSpeculatorConfig,
+                                             JAISConfig, MedusaConfig,
-                                             MPTConfig, NemotronConfig,
+                                             MLPSpeculatorConfig, MPTConfig,
-                                             RWConfig, UltravoxConfig)
+                                             NemotronConfig, RWConfig,
+                                             UltravoxConfig)
+# yapf: enable
 from vllm.transformers_utils.utils import check_gguf_file
 if VLLM_USE_MODELSCOPE:
@@ -39,6 +43,9 @@ _CONFIG_REGISTRY: Dict[str, Type[PretrainedConfig]] = {
    "internvl_chat": InternVLChatConfig,
    "nemotron": NemotronConfig,
    "ultravox": UltravoxConfig,
+    # Granite can be removed from here once we have upgraded to
+    # transformers 4.45+
+    "granite": GraniteConfig,
 }
 for name, cls in _CONFIG_REGISTRY.items():
@@ -62,6 +69,17 @@ def get_config(
        kwargs["gguf_file"] = Path(model).name
        model = Path(model).parent
+    config_dict, _ = PretrainedConfig.get_config_dict(
+        model, revision=revision, code_revision=code_revision, **kwargs)
+    # Use custom model class if it's in our registry
+    model_type = config_dict.get("model_type")
+    if model_type in _CONFIG_REGISTRY:
+        config_class = _CONFIG_REGISTRY[model_type]
+        config = config_class.from_pretrained(model,
+                                              revision=revision,
+                                              code_revision=code_revision)
+    else:
        try:
            config = AutoConfig.from_pretrained(
                model,
@@ -70,8 +88,9 @@ def get_config(
                code_revision=code_revision,
                **kwargs)
        except ValueError as e:
-        if (not trust_remote_code and
+            if (not trust_remote_code
-                "requires you to execute the configuration file" in str(e)):
+                    and "requires you to execute the configuration file"
+                    in str(e)):
                err_msg = (
                    "Failed to load the model config. If the model is a custom "
                    "model not yet available in the HuggingFace transformers "
@@ -80,11 +99,6 @@ def get_config(
                raise RuntimeError(err_msg) from e
            else:
                raise e
-    if config.model_type in _CONFIG_REGISTRY:
-        config_class = _CONFIG_REGISTRY[config.model_type]
-        config = config_class.from_pretrained(model,
-                                              revision=revision,
-                                              code_revision=code_revision)
    # Special architecture mapping check for GGUF models
    if is_gguf:

--- a/vllm/transformers_utils/configs/__init__.py
+++ b/vllm/transformers_utils/configs/__init__.py
@@ -6,6 +6,7 @@ from vllm.transformers_utils.configs.exaone import ExaoneConfig
 # tiiuae/falcon-7b(-instruct) models. Newer Falcon models will use the
 # `FalconConfig` class from the official HuggingFace transformers library.
 from vllm.transformers_utils.configs.falcon import RWConfig
+from vllm.transformers_utils.configs.granite import GraniteConfig
 from vllm.transformers_utils.configs.internvl import InternVLChatConfig
 from vllm.transformers_utils.configs.jais import JAISConfig
 from vllm.transformers_utils.configs.medusa import MedusaConfig
@@ -27,4 +28,7 @@ __all__ = [
    "MLPSpeculatorConfig",
    "NemotronConfig",
    "UltravoxConfig",
+    # Granite can be removed from here once we have upgraded to
+    # transformers 4.45+
+    "GraniteConfig",
 ]