OPT: BLIP2-ready `prepare_inputs_for_generation` (#21477)

10056d89 · Joao Gante · GitHub · baf4bacb · 10056d89
Unverified Commit 10056d89 authored Feb 06, 2023 by Joao Gante Committed by GitHub Feb 06, 2023
Hide whitespace changes
Inline Side-by-side

Showing with 16 additions and 12 deletions

src/transformers/models/opt/modeling_opt.py src/transformers/models/opt/modeling_opt.py +16 -12

No files found.
--- a/src/transformers/models/opt/modeling_opt.py
+++ b/src/transformers/models/opt/modeling_opt.py
@@ -965,21 +965,25 @@ class OPTForCausalLM(OPTPreTrainedModel):
        )
    def prepare_inputs_for_generation(
-        self, input_ids, past_key_values=None, attention_mask=None, use_cache=None, **kwargs
+        self, input_ids, past_key_values=None, attention_mask=None, inputs_embeds=None, **kwargs
    ):
-        # if model is used as a decoder in encoder-decoder model, the decoder attention mask is created on the fly
-        if attention_mask is None:
-            attention_mask = input_ids.new_ones(input_ids.shape)
        if past_key_values:
            input_ids = input_ids[:, -1:]
-        # first step, decoder_cached_states are empty
-        return {
+        # if `inputs_embeds` are passed, we only want to use them in the 1st generation step
-            "input_ids": input_ids,  # encoder_outputs is defined. input_ids not needed
+        if inputs_embeds is not None and past_key_values is None:
-            "attention_mask": attention_mask,
+            model_inputs = {"inputs_embeds": inputs_embeds}
-            "past_key_values": past_key_values,
+        else:
-            "use_cache": use_cache,
+            model_inputs = {"input_ids": input_ids}
-        }
+        model_inputs.update(
+            {
+                "past_key_values": past_key_values,
+                "use_cache": kwargs.get("use_cache"),
+                "attention_mask": attention_mask,
+            }
+        )
+        return model_inputs
    @staticmethod
    def _reorder_cache(past, beam_idx):