use memory_efficient_attention by default (#1354)

* use memory_efficient_attention by default * Update src/diffusers/models/attention.py Co-authored-by: Pedro Cuenca <pedro@huggingface.co>

use memory_efficient_attention by default (#1354)
* use memory_efficient_attention by default * Update src/diffusers/models/attention.py Co-authored-by: Pedro Cuenca <pedro@huggingface.co>
2d6d4edb · Suraj Patil · GitHub · 8b84f851 · 2d6d4edb
Unverified Commit 2d6d4edb authored Nov 22, 2022 by Suraj Patil Committed by GitHub Nov 22, 2022
Hide whitespace changes
Inline Side-by-side

Showing with 11 additions and 0 deletions

src/diffusers/models/attention.py src/diffusers/models/attention.py +11 -0

No files found.
--- a/src/diffusers/models/attention.py
+++ b/src/diffusers/models/attention.py
@@ -12,6 +12,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 import math
+import warnings
 from dataclasses import dataclass
 from typing import Optional

@@ -396,6 +397,16 @@ class BasicTransformerBlock(nn.Module):
            self.norm2 = nn.LayerNorm(dim)
        self.norm3 = nn.LayerNorm(dim)

+        # if xformers is installed try to use memory_efficient_attention by default
+        if is_xformers_available():
+            try:
+                self._set_use_memory_efficient_attention_xformers(True)
+            except Exception as e:
+                warnings.warn(
+                    "Could not enable memory efficient attention. Make sure xformers is installed"
+                    f" correctly and a GPU is available: {e}"
+                )
+
    def _set_attention_slice(self, slice_size):
        self.attn1._slice_size = slice_size
        self.attn2._slice_size = slice_size