Fix duplicate variable assignments in SD3's JointAttnProcessor (#8516)

* Fix duplicate variable assignments. * Fix duplicate variable assignments.

Fix duplicate variable assignments in SD3's JointAttnProcessor (#8516)
* Fix duplicate variable assignments. * Fix duplicate variable assignments.
896fb6d8 · ちくわぶ · GitHub · 7f51f286 · 896fb6d8 · 896fb6d8
Unverified Commit 896fb6d8 authored Jun 13, 2024 by ちくわぶ Committed by GitHub Jun 12, 2024
Show whitespace changes
Inline Side-by-side

Showing with 2 additions and 4 deletions

src/diffusers/models/attention_processor.py src/diffusers/models/attention_processor.py +1 -4

utils/update_metadata.py utils/update_metadata.py +1 -0

No files found.
--- a/src/diffusers/models/attention_processor.py
+++ b/src/diffusers/models/attention_processor.py
@@ -1132,9 +1132,7 @@ class JointAttnProcessor2_0:
        key = key.view(batch_size, -1, attn.heads, head_dim).transpose(1, 2)
        value = value.view(batch_size, -1, attn.heads, head_dim).transpose(1, 2)

-        hidden_states = hidden_states = F.scaled_dot_product_attention(
-            query, key, value, dropout_p=0.0, is_causal=False
-        )
+        hidden_states = F.scaled_dot_product_attention(query, key, value, dropout_p=0.0, is_causal=False)
        hidden_states = hidden_states.transpose(1, 2).reshape(batch_size, -1, attn.heads * head_dim)
        hidden_states = hidden_states.to(query.dtype)

@@ -1406,7 +1404,6 @@ class XFormersAttnProcessor:


 class AttnProcessorNPU:
-
    r"""
    Processor for implementing flash attention using torch_npu. Torch_npu supports only fp16 and bf16 data types. If
    fp32 is used, F.scaled_dot_product_attention will be used for computation, but the acceleration effect on NPU is

--- a/utils/update_metadata.py
+++ b/utils/update_metadata.py
@@ -24,6 +24,7 @@ python utils/update_metadata.py
 Script modified from:
 https://github.com/huggingface/transformers/blob/main/utils/update_metadata.py
 """
+
 import argparse
 import os
 import tempfile