convert suspicious fp16 regions back to fp32

aef97f4b · Bei Wang · 7384e2d6 · aef97f4b · aef97f4b · aef97f4b
Commit aef97f4b authored Sep 21, 2022 by Bei Wang
5 changed files
--- a/openfold/model/heads.py
+++ b/openfold/model/heads.py
@@ -137,7 +137,7 @@ class DistogramHead(nn.Module):

        self.linear = Linear(self.c_z, self.no_bins, init="final")

-    def forward(self, z):  # [*, N, N, C_z]
+    def _forward(self, z):  # [*, N, N, C_z]
        """
        Args:
            z:
@@ -150,6 +150,14 @@ class DistogramHead(nn.Module):
        logits = logits + logits.transpose(-2, -3)
        return logits
    
+    def forward(self, z):
+        
+        float16_enabled = (torch.get_autocast_gpu_dtype() == torch.float16)
+        if float16_enabled and torch.is_autocast_enabled():
+            with torch.cuda.amp.autocast(enabled=False):
+                return self._forward(z.float())
+        else:
+            return self._forward(z)
        
 class TMScoreHead(nn.Module):
    """

--- a/openfold/model/outer_product_mean.py
+++ b/openfold/model/outer_product_mean.py
@@ -93,7 +93,7 @@ class OuterProductMean(nn.Module):

        return outer

-    def forward(self, 
+    def _forward(self, 
        m: torch.Tensor, 
        mask: Optional[torch.Tensor] = None,
        chunk_size: Optional[int] = None,
@@ -143,3 +143,18 @@ class OuterProductMean(nn.Module):
            outer = outer / norm

        return outer
+
+    def forward(self,
+                m: torch.Tensor,
+                mask: Optional[torch.Tensor] = None,
+                chunk_size: Optional[int] = None,
+                inplace_safe: bool = False,
+    ) -> torch.Tensor:
+
+        float16_enabled = (torch.get_autocast_gpu_dtype() == torch.float16)
+        if float16_enabled and torch.is_autocast_enabled():
+            with torch.cuda.amp.autocast(enabled=False):
+                return self._forward(m.float(), mask, chunk_size, inplace_safe)
+        else:
+            return self._forward(m, mask, chunk_size, inplace_safe)
+        
--- a/openfold/model/primitives.py
+++ b/openfold/model/primitives.py
@@ -479,6 +479,7 @@ class Attention(nn.Module):
        q, k, v = self._prep_qkv(q_x, kv_x)

        # [*, Q, H, C_hidden]
+        use_memory_efficient_kernel = False
        if(use_memory_efficient_kernel):
            if(len(biases) > 2):
                raise ValueError(

--- a/openfold/model/structure_module.py
+++ b/openfold/model/structure_module.py
@@ -312,6 +312,14 @@ class InvariantPointAttention(nn.Module):
            z[0] = z[0].cpu()

        # [*, H, N_res, N_res]
+        float16_enabled = (torch.get_autocast_gpu_dtype() == torch.float16)
+        if float16_enabled and torch.is_autocast_enabled():
+            with torch.cuda.amp.autocast(enabled=False):
+                a = torch.matmul(
+                    permute_final_dims(q.float(), (1, 0, 2)),  # [*, H, N_res, C_hidden]
+                    permute_final_dims(k.float(), (1, 2, 0)),  # [*, H, C_hidden, N_res]
+                )
+        else:
            a = torch.matmul(
                permute_final_dims(q, (1, 0, 2)),  # [*, H, N_res, C_hidden]
                permute_final_dims(k, (1, 2, 0)),  # [*, H, C_hidden, N_res]

--- a/openfold/model/triangular_multiplicative_update.py
+++ b/openfold/model/triangular_multiplicative_update.py
@@ -391,6 +391,11 @@ class TriangleMultiplicativeUpdate(nn.Module):
        b = mask
        b = b * self.sigmoid(self.linear_b_g(z))
        b = b * self.linear_b_p(z)
+        float16_enabled = (torch.get_autocast_gpu_dtype() == torch.float16)
+        if float16_enabled and torch.is_autocast_enabled():
+            with torch.cuda.amp.autocast(enabled=False):
+                x = self._combine_projections(a.float(), b.float())
+        else:
            x = self._combine_projections(a, b)
        del a, b
        x = self.layer_norm_out(x)