Merge branch 'lmcafee/free-pipe-output-bug' into 'main'

Bugfix: Pipeline output deallocation w/ persistent layer norm See merge request ADLR/megatron-lm!402

Merge branch 'lmcafee/free-pipe-output-bug' into 'main'
Bugfix: Pipeline output deallocation w/ persistent layer norm See merge request ADLR/megatron-lm!402
15f6bb1b · Jared Casper · 53f3efc4 · 65e6bc32 · 15f6bb1b
Commit 15f6bb1b authored Mar 15, 2022 by Jared Casper
Hide whitespace changes
Inline Side-by-side

Showing with 12 additions and 1 deletion

megatron/model/fused_layer_norm.py megatron/model/fused_layer_norm.py +12 -1

No files found.
--- a/megatron/model/fused_layer_norm.py
+++ b/megatron/model/fused_layer_norm.py
@@ -23,6 +23,8 @@ from torch.nn.parameter import Parameter
 from torch.nn import init
 import importlib
+from megatron.mpu import make_viewless_tensor
 try:
    from apex.contrib.layer_norm.layer_norm import FastLayerNormFN
    HAVE_PERSIST_LAYER_NORM = True
@@ -106,6 +108,15 @@ class MixedFusedLayerNorm(torch.nn.Module):
        return FusedLayerNormAffineFunction.apply(
          input, self.weight, self.bias, self.normalized_shape, self.eps)
    else:
-        return FastLayerNormFN.apply(
+        output = FastLayerNormFN.apply(
          input, self.weight, self.bias, self.eps)
+        # Apex's fast layer norm function outputs a 'view' tensor (i.e., has
+        # a populated '_base' field). This will result in schedule.py's
+        # deallocate_output_tensor() throwing an error, so a viewless tensor is
+        # created to prevent this.
+        output = make_viewless_tensor(inp = output,
+                                      requires_grad = input.requires_grad,
+                                      keep_graph = True)
+        return output