Removed assert in case of external ddp, exported initialize_megatron()

Signed-off-by: Boris Fomitchev <bfomitchev@nvidia.com>

Removed assert in case of external ddp, exported initialize_megatron()
Signed-off-by: Boris Fomitchev <bfomitchev@nvidia.com>
be842037 · Boris Fomitchev · 323c124d · be842037 · be842037
Commit be842037 authored Aug 06, 2020 by Boris Fomitchev
Show whitespace changes
Inline Side-by-side

Showing with 2 additions and 7 deletions

megatron/__init__.py megatron/__init__.py +2 -2

megatron/initialize.py megatron/initialize.py +0 -5

No files found.
--- a/megatron/__init__.py
+++ b/megatron/__init__.py
@@ -30,7 +30,7 @@ from .global_vars import get_tokenizer
 from .global_vars import get_tensorboard_writer
 from .global_vars import get_adlr_autoresume
 from .global_vars import get_timers
+from .initialize  import initialize_megatron
 def print_rank_0(message):
    """If distributed is initialized print only on rank 0."""

--- a/megatron/initialize.py
+++ b/megatron/initialize.py
@@ -93,11 +93,6 @@ def _initialize_distributed():
                  'skipping initialization ...', flush=True)
        args.rank = torch.distributed.get_rank()
        args.world_size = torch.distributed.get_world_size()
-        if device_count > 0:
-            device = torch.cuda.current_device()
-            local_rank = args.rank % device_count
-            assert local_rank == device, \
-                'expected local-rank to be the same as rank % device-count.'
    else: