Improve memory management in extra msa stack

e310bba4 · Gustaf Ahdritz · cdadff32 · e310bba4
Commit e310bba4 authored Apr 05, 2022 by Gustaf Ahdritz
Hide whitespace changes
Inline Side-by-side

Showing with 16 additions and 6 deletions

openfold/model/evoformer.py openfold/model/evoformer.py +16 -6

No files found.
--- a/openfold/model/evoformer.py
+++ b/openfold/model/evoformer.py
@@ -352,20 +352,30 @@ class ExtraMSABlock(nn.Module):
        chunk_size: Optional[int] = None,
        _chunk_logits: Optional[int] = 1024,
    ) -> Tuple[torch.Tensor, torch.Tensor]:
-        m = m + self.msa_dropout_layer(
+        def add(m1, m2):
+            # The first operation in a checkpoint can't be in-place, but it's
+            # nice to have in-place addition during inference. Thus...
+            if(torch.is_grad_enabled()):
+                m1 = m1 + m2
+            else:
+                m1 += m2
+            return m1
+        m = add(m, self.msa_dropout_layer(
            self.msa_att_row(
-                m.clone(), 
+                m.clone() if torch.is_grad_enabled() else m, 
-                z=z.clone(), 
+                z=z.clone() if torch.is_grad_enabled() else z, 
                mask=msa_mask, 
                chunk_size=chunk_size,
                _chunk_logits=_chunk_logits if torch.is_grad_enabled() else None,
                _checkpoint_chunks=
                    self.ckpt if torch.is_grad_enabled() else False,
            )
-        )
+        ))
        def fn(m, z):
-            m = m + self.msa_att_col(m, mask=msa_mask, chunk_size=chunk_size)
+            m = add(m, self.msa_att_col(m, mask=msa_mask, chunk_size=chunk_size))
            m, z = self.core(
                m, z, msa_mask=msa_mask, pair_mask=pair_mask, chunk_size=chunk_size
            )