NPU adaption for RMSNorm (#10534)

* NPU adaption for RMSNorm * NPU adaption for RMSNorm --------- Co-authored-by: J石页 <jiangshuo9@h-partners.com>

NPU adaption for RMSNorm (#10534)
* NPU adaption for RMSNorm * NPU adaption for RMSNorm --------- Co-authored-by: J石页 <jiangshuo9@h-partners.com>
cecada52 · Leo Jiang · GitHub · 17d99c4d · cecada52
Unverified Commit cecada52 authored Jan 16, 2025 by Leo Jiang Committed by GitHub Jan 16, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 22 additions and 11 deletions

src/diffusers/models/normalization.py src/diffusers/models/normalization.py +22 -11

No files found.
--- a/src/diffusers/models/normalization.py
+++ b/src/diffusers/models/normalization.py
@@ -20,7 +20,7 @@ import torch
 import torch.nn as nn
 import torch.nn.functional as F
-from ..utils import is_torch_version
+from ..utils import is_torch_npu_available, is_torch_version
 from .activations import get_activation
 from .embeddings import CombinedTimestepLabelEmbeddings, PixArtAlphaCombinedTimestepSizeEmbeddings
@@ -505,19 +505,30 @@ class RMSNorm(nn.Module):
                self.bias = nn.Parameter(torch.zeros(dim))
    def forward(self, hidden_states):
-        input_dtype = hidden_states.dtype
+        if is_torch_npu_available():
-        variance = hidden_states.to(torch.float32).pow(2).mean(-1, keepdim=True)
+            import torch_npu
-        hidden_states = hidden_states * torch.rsqrt(variance + self.eps)
+            if self.weight is not None:
-        if self.weight is not None:
+                # convert into half-precision if necessary
-            # convert into half-precision if necessary
+                if self.weight.dtype in [torch.float16, torch.bfloat16]:
-            if self.weight.dtype in [torch.float16, torch.bfloat16]:
+                    hidden_states = hidden_states.to(self.weight.dtype)
-                hidden_states = hidden_states.to(self.weight.dtype)
+            hidden_states = torch_npu.npu_rms_norm(hidden_states, self.weight, epsilon=self.eps)[0]
-            hidden_states = hidden_states * self.weight
            if self.bias is not None:
                hidden_states = hidden_states + self.bias
        else:
-            hidden_states = hidden_states.to(input_dtype)
+            input_dtype = hidden_states.dtype
+            variance = hidden_states.to(torch.float32).pow(2).mean(-1, keepdim=True)
+            hidden_states = hidden_states * torch.rsqrt(variance + self.eps)
+            if self.weight is not None:
+                # convert into half-precision if necessary
+                if self.weight.dtype in [torch.float16, torch.bfloat16]:
+                    hidden_states = hidden_states.to(self.weight.dtype)
+                hidden_states = hidden_states * self.weight
+                if self.bias is not None:
+                    hidden_states = hidden_states + self.bias
+            else:
+                hidden_states = hidden_states.to(input_dtype)
        return hidden_states