[LLaVa] Add past_key_values to _skip_keys_device_placement to fix multi-GPU dispatch (#28051)

Add past_key_values to _skip_keys_device_placement for LLaVa

[LLaVa] Add past_key_values to _skip_keys_device_placement to fix multi-GPU dispatch (#28051)
Add past_key_values to _skip_keys_device_placement for LLaVa
e2b6df79 · Adilzhan Ismailov · GitHub · deb72cb6 · e2b6df79 · e2b6df79
Unverified Commit e2b6df79 authored Dec 15, 2023 by Adilzhan Ismailov Committed by GitHub Dec 15, 2023
Showing with 2 additions and 0 deletions

src/transformers/models/llava/modeling_llava.py src/transformers/models/llava/modeling_llava.py +1 -0

src/transformers/models/vipllava/modeling_vipllava.py src/transformers/models/vipllava/modeling_vipllava.py +1 -0

No files found.
--- a/src/transformers/models/llava/modeling_llava.py
+++ b/src/transformers/models/llava/modeling_llava.py
@@ -130,6 +130,7 @@ class LlavaPreTrainedModel(PreTrainedModel):
    base_model_prefix = "model"
    supports_gradient_checkpointing = True
    _no_split_modules = ["LlavaVisionAttention"]
+    _skip_keys_device_placement = "past_key_values"
    _supports_flash_attn_2 = True
    def _init_weights(self, module):

--- a/src/transformers/models/vipllava/modeling_vipllava.py
+++ b/src/transformers/models/vipllava/modeling_vipllava.py
@@ -137,6 +137,7 @@ class VipLlavaPreTrainedModel(PreTrainedModel):
    base_model_prefix = "model"
    supports_gradient_checkpointing = True
    _no_split_modules = ["VipLlavaVisionAttention"]
+    _skip_keys_device_placement = "past_key_values"
    _supports_flash_attn_2 = True
    def _init_weights(self, module):