Syncbuf (#447)

* More robust sync buffer hook * More robust sync buffer hook * Reformat

Syncbuf (#447)
* More robust sync buffer hook * More robust sync buffer hook * Reformat
d4da3daa · Wang Xinjiang · GitHub · cec5aace · d4da3daa · d4da3daa
Unverified Commit d4da3daa authored Jul 25, 2020 by Wang Xinjiang Committed by GitHub Jul 25, 2020
Showing with 13 additions and 2 deletions

mmcv/runner/hooks/__init__.py mmcv/runner/hooks/__init__.py +2 -1

mmcv/runner/hooks/sync_buffer.py mmcv/runner/hooks/sync_buffer.py +3 -1

tests/test_runner/test_hooks.py tests/test_runner/test_hooks.py +8 -0

No files found.
--- a/mmcv/runner/hooks/__init__.py
+++ b/mmcv/runner/hooks/__init__.py
@@ -10,11 +10,12 @@ from .memory import EmptyCacheHook
 from .momentum_updater import MomentumUpdaterHook
 from .optimizer import Fp16OptimizerHook, OptimizerHook
 from .sampler_seed import DistSamplerSeedHook
+from .sync_buffer import SyncBuffersHook

 __all__ = [
    'HOOKS', 'Hook', 'CheckpointHook', 'ClosureHook', 'LrUpdaterHook',
    'OptimizerHook', 'Fp16OptimizerHook', 'IterTimerHook',
    'DistSamplerSeedHook', 'EmptyCacheHook', 'LoggerHook', 'MlflowLoggerHook',
    'PaviLoggerHook', 'TextLoggerHook', 'TensorboardLoggerHook',
-    'WandbLoggerHook', 'MomentumUpdaterHook'
+    'WandbLoggerHook', 'MomentumUpdaterHook', 'SyncBuffersHook'
 ]
--- a/mmcv/runner/hooks/sync_buffer.py
+++ b/mmcv/runner/hooks/sync_buffer.py
 # Copyright (c) Open-MMLab. All rights reserved.
 import torch.distributed as dist

+from ..dist_utils import get_dist_info
 from .hook import HOOKS, Hook


@@ -19,7 +20,8 @@ class SyncBuffersHook(Hook):

    def after_epoch(self, runner):
        """All-reduce model buffers at the end of each epoch."""
-        if self.distributed:
+        _, world_size = get_dist_info()
+        if self.distributed and world_size > 1:
            buffers = runner.model.buffers()
            world_size = dist.get_world_size()
            for tensor in buffers:

--- a/tests/test_runner/test_hooks.py
+++ b/tests/test_runner/test_hooks.py
@@ -42,6 +42,14 @@ def test_pavi_hook():
        iteration=5)


+def test_sync_buffers_hook():
+    loader = DataLoader(torch.ones((5, 2)))
+    runner = _build_demo_runner()
+    runner.register_hook_from_cfg(dict(type='SyncBuffersHook'))
+    runner.run([loader, loader], [('train', 1), ('val', 1)], 1)
+    shutil.rmtree(runner.work_dir)
+
+
 def test_momentum_runner_hook():
    """xdoctest -m tests/test_hooks.py test_momentum_runner_hook."""
    sys.modules['pavi'] = MagicMock()