Merge branch 'core-fix' into 'main'

Fix merge error. See merge request ADLR/megatron-lm!478

Merge branch 'core-fix' into 'main'
Fix merge error. See merge request ADLR/megatron-lm!478
1a26b291 · Jared Casper · 42c40715 · e0a12fe1 · 1a26b291
Commit 1a26b291 authored Nov 08, 2022 by Jared Casper
Hide whitespace changes
Inline Side-by-side

Showing with 4 additions and 4 deletions

megatron/model/transformer.py megatron/model/transformer.py +4 -4

No files found.
--- a/megatron/model/transformer.py
+++ b/megatron/model/transformer.py
@@ -738,7 +738,7 @@ class NoopTransformerLayer(MegatronModule):
 def _get_num_layers(args, is_encoder_and_decoder_model, is_decoder=False):
    """Compute the number of transformer layers resident on the current rank."""
-    if get_pipeline_model_parallel_world_size() > 1:
+    if mpu.get_pipeline_model_parallel_world_size() > 1:
        if is_encoder_and_decoder_model:
            assert args.pipeline_model_parallel_split_rank is not None
@@ -756,11 +756,11 @@ def _get_num_layers(args, is_encoder_and_decoder_model, is_decoder=False):
                    'encoder_num_layers (%d) must be divisible by number of ranks given to encoder (%d)' % (args.encoder_num_layers, num_ranks_in_encoder)
            assert args.decoder_num_layers % num_ranks_in_decoder == 0, \
                    'decoder_num_layers (%d) must be divisible by number of ranks given to decoder (%d)' % (args.decoder_num_layers, num_ranks_in_decoder)
-            if is_pipeline_stage_before_split():
+            if mpu.is_pipeline_stage_before_split():
                num_layers = (
                    0
                    if args.standalone_embedding_stage
-                    and get_pipeline_model_parallel_rank() == 0 else
+                    and mpu.get_pipeline_model_parallel_rank() == 0 else
                    args.encoder_num_layers // num_ranks_in_encoder
                )
            else:
@@ -777,7 +777,7 @@ def _get_num_layers(args, is_encoder_and_decoder_model, is_decoder=False):
            num_layers = (
                0
                if args.standalone_embedding_stage
-                and get_pipeline_model_parallel_rank() == 0 else
+                and mpu.get_pipeline_model_parallel_rank() == 0 else
                args.num_layers // args.transformer_pipeline_model_parallel_size
            )
    else: