Modified altdiffusion pipline to support altdiffusion-m18 (#2993)

* Modified altdiffusion pipline to support altdiffusion-m18 * Modified altdiffusion pipline to support altdiffusion-m18 * Modified altdiffusion pipline to support altdiffusion-m18 * Modified altdiffusion pipline to support altdiffusion-m18 * Modified altdiffusion pipline to support altdiffusion-m18 * Modified altdiffusion pipline to support altdiffusion-m18 * Modified altdiffusion pipline to support altdiffusion-m18 --------- Co-authored-by: root <fulong_ye@163.com>

Modified altdiffusion pipline to support altdiffusion-m18 (#2993)
* Modified altdiffusion pipline to support altdiffusion-m18 * Modified altdiffusion pipline to support altdiffusion-m18 * Modified altdiffusion pipline to support altdiffusion-m18 * Modified altdiffusion pipline to support altdiffusion-m18 * Modified altdiffusion pipline to support altdiffusion-m18 * Modified altdiffusion pipline to support altdiffusion-m18 * Modified altdiffusion pipline to support altdiffusion-m18 --------- Co-authored-by: root <fulong_ye@163.com>
a4c91be7 · superhero-7 · GitHub · 3becd368 · a4c91be7
Unverified Commit a4c91be7 authored Apr 20, 2023 by superhero-7 Committed by GitHub Apr 19, 2023
Hide whitespace changes
Inline Side-by-side

Showing with 25 additions and 10 deletions

src/diffusers/pipelines/alt_diffusion/modeling_roberta_series.py ...fusers/pipelines/alt_diffusion/modeling_roberta_series.py +25 -10

No files found.
--- a/src/diffusers/pipelines/alt_diffusion/modeling_roberta_series.py
+++ b/src/diffusers/pipelines/alt_diffusion/modeling_roberta_series.py
@@ -56,7 +56,7 @@ class RobertaSeriesConfig(XLMRobertaConfig):
 class RobertaSeriesModelWithTransformation(RobertaPreTrainedModel):
-    _keys_to_ignore_on_load_unexpected = [r"pooler"]
+    _keys_to_ignore_on_load_unexpected = [r"pooler", r"logit_scale"]
    _keys_to_ignore_on_load_missing = [r"position_ids", r"predictions.decoder.bias"]
    base_model_prefix = "roberta"
    config_class = RobertaSeriesConfig
@@ -65,6 +65,10 @@ class RobertaSeriesModelWithTransformation(RobertaPreTrainedModel):
        super().__init__(config)
        self.roberta = XLMRobertaModel(config)
        self.transformation = nn.Linear(config.hidden_size, config.project_dim)
+        self.has_pre_transformation = getattr(config, "has_pre_transformation", False)
+        if self.has_pre_transformation:
+            self.transformation_pre = nn.Linear(config.hidden_size, config.project_dim)
+            self.pre_LN = nn.LayerNorm(config.hidden_size, eps=config.layer_norm_eps)
        self.post_init()
    def forward(
@@ -95,15 +99,26 @@ class RobertaSeriesModelWithTransformation(RobertaPreTrainedModel):
            encoder_hidden_states=encoder_hidden_states,
            encoder_attention_mask=encoder_attention_mask,
            output_attentions=output_attentions,
-            output_hidden_states=output_hidden_states,
+            output_hidden_states=True if self.has_pre_transformation else output_hidden_states,
            return_dict=return_dict,
        )
-        projection_state = self.transformation(outputs.last_hidden_state)
+        if self.has_pre_transformation:
+            sequence_output2 = outputs["hidden_states"][-2]
-        return TransformationModelOutput(
+            sequence_output2 = self.pre_LN(sequence_output2)
-            projection_state=projection_state,
+            projection_state2 = self.transformation_pre(sequence_output2)
-            last_hidden_state=outputs.last_hidden_state,
-            hidden_states=outputs.hidden_states,
+            return TransformationModelOutput(
-            attentions=outputs.attentions,
+                projection_state=projection_state2,
-        )
+                last_hidden_state=outputs.last_hidden_state,
+                hidden_states=outputs.hidden_states,
+                attentions=outputs.attentions,
+            )
+        else:
+            projection_state = self.transformation(outputs.last_hidden_state)
+            return TransformationModelOutput(
+                projection_state=projection_state,
+                last_hidden_state=outputs.last_hidden_state,
+                hidden_states=outputs.hidden_states,
+                attentions=outputs.attentions,
+            )