Remove runner, parallel, engine and device (#2216)

* Remove runner, parallel, engine and device * fix format * remove outdated docs

Remove runner, parallel, engine and device (#2216)
* Remove runner, parallel, engine and device * fix format * remove outdated docs
9185eee8 · Zaida Zhou · GitHub · 19a02415 · 19a02415 · 19a02415
Unverified Commit 9185eee8 authored Aug 22, 2022 by Zaida Zhou Committed by GitHub Aug 22, 2022
16 changed files
--- a/tests/test_device/test_ipu/test_ipu_model.py
+++ b/tests/test_device/test_ipu/test_ipu_model.py
-# Copyright (c) OpenMMLab. All rights reserved.
-import logging
-import numpy as np
-import pytest
-import torch
-import torch.nn as nn
-from mmcv.runner.fp16_utils import auto_fp16
-from mmcv.utils import IS_IPU_AVAILABLE
-if IS_IPU_AVAILABLE:
-    from mmcv.device.ipu import cfg2options, ipu_model_wrapper
-    from mmcv.device.ipu.utils import compare_ndarray
-skip_no_ipu = pytest.mark.skipif(
-    not IS_IPU_AVAILABLE, reason='test case under ipu environment')
-class MyBN(nn.BatchNorm2d):
-    def forward(self, *args, **kwargs):
-        result = super().forward(*args, **kwargs)
-        return result, self.running_mean
-# TODO Once the model training and inference interfaces
-# of MMCLS and MMDET are unified,
-# construct the model according to the unified standards
-class ToyModel(nn.Module):
-    def __init__(self):
-        super().__init__()
-        self.conv = nn.Conv2d(3, 3, 1)
-        self.bn = MyBN(3)
-        self.relu = nn.ReLU6()
-        self.fp16_enabled = False
-    @auto_fp16(apply_to=('img', ))
-    def forward(self, img, return_loss=True, **kwargs):
-        x = self.conv(img)
-        x, running_mean = self.bn(x)
-        x = self.relu(x)
-        if return_loss:
-            loss = ((x - kwargs['gt_label'])**2).sum()
-            return {
-                'loss': loss,
-                'loss_list': [loss, loss],
-                'loss_dict': {
-                    'loss1': loss
-                }
-            }
-        return x
-    def _parse_losses(self, losses):
-        return losses['loss'], losses['loss']
-    def train_step(self, data, optimizer=None, **kwargs):
-        losses = self(**data)
-        loss, log_vars = self._parse_losses(losses)
-        outputs = dict(
-            loss=loss, log_vars=log_vars, num_samples=len(data['img'].data))
-        return outputs
-@skip_no_ipu
-def test_build_model():
-    for execution_strategy in \
-            ['SameAsIpu', 'ShardedExecution', 'error_strategy']:
-        if execution_strategy == 'error_strategy':
-            def maybe_catch_error(_error):
-                return pytest.raises(_error)
-        else:
-            class NullContextManager:
-                def __enter__(self, ):
-                    pass
-                def __exit__(self, exc_type, exc_value, exc_traceback):
-                    pass
-            def maybe_catch_error(_error):
-                return NullContextManager()
-        with maybe_catch_error(NotImplementedError):
-            options_cfg = dict(
-                randomSeed=888,
-                enableExecutableCaching='cache_engine',
-                train_cfg=dict(
-                    executionStrategy=execution_strategy,
-                    Training=dict(gradientAccumulation=8),
-                    availableMemoryProportion=[0.3, 0.3, 0.3, 0.3]),
-                eval_cfg=dict(deviceIterations=1, ),
-                partialsType='half')
-            ipu_options = cfg2options(options_cfg)
-            model = ToyModel()
-            optimizer = torch.optim.SGD(model.parameters(), lr=0.1)
-            logger = logging.getLogger()
-            modules_to_record = None
-            ipu_model_cfg = dict(
-                train_split_edges=[dict(layer_to_call='conv', ipu_id=0)],
-                train_ckpt_nodes=['bn', 'conv'])
-            fp16_cfg = {'loss_scale': 0.5}
-            ipu_model = ipu_model_wrapper(
-                model,
-                ipu_options,
-                optimizer,
-                logger,
-                modules_to_record=modules_to_record,
-                ipu_model_cfg=ipu_model_cfg,
-                fp16_cfg=fp16_cfg)
-            ipu_model.train()
-            ipu_model.eval()
-            ipu_model.train()
-def run_model(ipu_options,
-              fp16_cfg,
-              modules_to_record,
-              ipu_model_wrapper_func,
-              only_eval=False):
-    model = ToyModel()
-    optimizer = torch.optim.SGD(model.parameters(), lr=0.1)\
-        if not only_eval else None
-    logger = logging.getLogger()
-    ipu_model_cfg = dict(
-        train_split_edges=[dict(layer_to_call='conv', ipu_id=0)],
-        train_ckpt_nodes=['bn', 'conv'])
-    ipu_model = ipu_model_wrapper_func(
-        model,
-        ipu_options,
-        optimizer,
-        logger,
-        modules_to_record=modules_to_record,
-        ipu_model_cfg=ipu_model_cfg,
-        fp16_cfg=fp16_cfg)
-    def get_dummy_input(training):
-        if training:
-            return {
-                'data': {
-                    'img': torch.rand((16, 3, 10, 10)),
-                    'gt_label': torch.rand((16, 3, 10, 10))
-                }
-            }
-        else:
-            return {
-                'img': torch.rand((16, 3, 10, 10)),
-                'img_metas': {
-                    'img': torch.rand((16, 3, 10, 10))
-                },
-                'return_loss': False
-            }
-    if not only_eval:
-        training = True
-        ipu_model.train()
-        for _ in range(3):
-            dummy_input = get_dummy_input(training)
-            output = ipu_model.train_step(**dummy_input)
-    training = False
-    ipu_model.eval()
-    for _ in range(3):
-        dummy_input = get_dummy_input(training)
-        output = ipu_model(**dummy_input)
-    return output, ipu_model
-@skip_no_ipu
-def test_run_model():
-    # test feature alignment not support gradientAccumulation mode
-    options_cfg = dict(
-        randomSeed=888,
-        enableExecutableCaching='cache_engine',
-        train_cfg=dict(
-            executionStrategy='SameAsIpu',
-            Training=dict(gradientAccumulation=8),
-            availableMemoryProportion=[0.3, 0.3, 0.3, 0.3],
-        ),
-        eval_cfg=dict(deviceIterations=1, ),
-        partialsType='half')
-    ipu_options = cfg2options(options_cfg)
-    modules_to_record = ['bn']
-    with pytest.raises(AssertionError, match='Feature alignment'):
-        run_model(ipu_options, None, modules_to_record, ipu_model_wrapper)
-    # test feature alignment not support multi-replica mode
-    options_cfg = dict(
-        randomSeed=888,
-        replicationFactor=2,
-        enableExecutableCaching='cache_engine',
-        train_cfg=dict(
-            executionStrategy='SameAsIpu',
-            availableMemoryProportion=[0.3, 0.3, 0.3, 0.3],
-        ),
-        eval_cfg=dict(deviceIterations=1, ),
-        partialsType='half')
-    ipu_options = cfg2options(options_cfg)
-    modules_to_record = ['bn']
-    with pytest.raises(AssertionError, match='Feature alignment'):
-        run_model(ipu_options, None, modules_to_record, ipu_model_wrapper)
-    # test feature alignment not support fp16 mode
-    options_cfg = dict(
-        randomSeed=888,
-        enableExecutableCaching='cache_engine',
-        train_cfg=dict(
-            executionStrategy='SameAsIpu',
-            availableMemoryProportion=[0.3, 0.3, 0.3, 0.3],
-        ),
-        eval_cfg=dict(deviceIterations=1, ),
-        partialsType='half')
-    ipu_options = cfg2options(options_cfg)
-    fp16_cfg = {
-        'loss_scale': 0.5,
-        'velocity_accum_type': 'half',
-        'accum_type': 'half'
-    }
-    modules_to_record = ['bn']
-    with pytest.raises(NotImplementedError):
-        run_model(ipu_options, fp16_cfg, modules_to_record, ipu_model_wrapper)
-    # test velocity_accum_type and accum_type
-    fp16_cfg = {
-        'loss_scale': 0.5,
-        'velocity_accum_type': 'float',
-        'accum_type': 'float'
-    }
-    run_model(ipu_options, fp16_cfg, None, ipu_model_wrapper)
-    # test compile and run
-    options_cfg = dict(
-        randomSeed=888,
-        enableExecutableCaching='cache_engine',
-        train_cfg=dict(
-            executionStrategy='SameAsIpu',
-            availableMemoryProportion=[0.3, 0.3, 0.3, 0.3],
-        ),
-        eval_cfg=dict(deviceIterations=1, ),
-        partialsType='half')
-    ipu_options = cfg2options(options_cfg)
-    modules_to_record = ['bn']
-    run_model(ipu_options, None, modules_to_record, ipu_model_wrapper)
-    # test feature alignment
-    options_cfg = dict(
-        randomSeed=888,
-        enableExecutableCaching='cache_engine',
-        train_cfg=dict(
-            executionStrategy='SameAsIpu',
-            availableMemoryProportion=[0.3, 0.3, 0.3, 0.3],
-        ),
-        eval_cfg=dict(deviceIterations=1, ))
-    ipu_options = cfg2options(options_cfg)
-    modules_to_record = None
-    run_model(ipu_options, None, modules_to_record, ipu_model_wrapper)
-    # test inference mode
-    options_cfg = dict(
-        randomSeed=888,
-        enableExecutableCaching='cache_engine',
-        train_cfg=dict(
-            executionStrategy='SameAsIpu',
-            availableMemoryProportion=[0.3, 0.3, 0.3, 0.3],
-        ),
-        eval_cfg=dict(deviceIterations=1, ),
-        partialsType='half')
-    ipu_options = cfg2options(options_cfg)
-    fp16_cfg = {'loss_scale': 0.5}
-    modules_to_record = None
-    _, ipu_model = run_model(
-        ipu_options,
-        fp16_cfg,
-        modules_to_record,
-        ipu_model_wrapper,
-        only_eval=True)
-    with pytest.raises(RuntimeError):
-        ipu_model.train()
-    with pytest.raises(ValueError):
-        ipu_model.train(123)
-    _, ipu_model = run_model(ipu_options, None, modules_to_record,
-                             ipu_model_wrapper)
-    # test NotImplementedError in __call__
-    ipu_model.train()
-    with pytest.raises(NotImplementedError):
-        ipu_model()
-    # test parse_losses
-    with pytest.raises(TypeError):
-        ipu_model._model.model._parse_losses({'loss': None})
-@skip_no_ipu
-def test_compare_tensor():
-    compare_ndarray(np.random.rand(3, 4), np.random.rand(3, 4))
--- a/tests/test_device/test_ipu/test_ipu_runner.py
+++ b/tests/test_device/test_ipu/test_ipu_runner.py
-# Copyright (c) OpenMMLab. All rights reserved.
-import logging
-import os.path as osp
-import pytest
-import torch
-import torch.nn as nn
-from torch.utils.data import Dataset
-from mmcv.runner import build_runner
-from mmcv.utils import IS_IPU_AVAILABLE
-if IS_IPU_AVAILABLE:
-    from mmcv.device.ipu import IPUDataLoader, runner
-skip_no_ipu = pytest.mark.skipif(
-    not IS_IPU_AVAILABLE, reason='test case under ipu environment')
-# Most of its functions are inherited from EpochBasedRunner and IterBasedRunner
-# So only do incremental testing on overridden methods
-# Comparing with base runner,
-# Overridden functions are listed below:
-# __init__, register_lr_hook, register_optimizer_hook
-# register_lr_hook and register_optimizer_hook are tested in test_runner.py
-class OldStyleModel(nn.Module):
-    def __init__(self):
-        super().__init__()
-        self.conv = nn.Conv2d(3, 3, 1)
-class Model(OldStyleModel):
-    def train_step(self):
-        pass
-    def val_step(self):
-        pass
-class ToyModel(nn.Module):
-    def __init__(self):
-        super().__init__()
-        self.conv = nn.Conv2d(3, 3, 1)
-        self.bn = nn.BatchNorm2d(3)
-        self.relu = nn.ReLU6()
-        self.fp16_enabled = False
-    def forward(self, img, return_loss=True, **kwargs):
-        x = self.conv(img)
-        x = self.bn(x)
-        x = self.relu(x)
-        if return_loss:
-            loss = ((x - kwargs['gt_label'])**2).sum()
-            return {'loss': loss, 'loss1': loss + 1}
-        return x
-    def _parse_losses(self, losses):
-        return losses['loss'], {'loss1': losses['loss']}
-    def train_step(self, data, optimizer=None, **kwargs):
-        losses = self(**data)
-        loss, log_vars = self._parse_losses(losses)
-        outputs = dict(
-            loss=loss, log_vars=log_vars, num_samples=len(data['img'].data))
-        return outputs
-class ToyDataset(Dataset):
-    def __getitem__(self, index):
-        return {
-            'img': torch.rand((3, 10, 10)),
-            'gt_label': torch.rand((3, 10, 10))
-        }
-    def __len__(self, ):
-        return 3
-@skip_no_ipu
-def test_build_runner(tmp_path):
-    # __init__
-    dir_name = 'a_tmp_dir'
-    default_args = dict(
-        model=Model(),
-        work_dir=osp.join(tmp_path, dir_name),
-        logger=logging.getLogger())
-    cfg = dict(type='IPUEpochBasedRunner', max_epochs=1)
-    ipu_runner = build_runner(cfg, default_args=default_args)
-    assert ipu_runner._max_epochs == 1
-    cfg = dict(type='IPUIterBasedRunner', max_iters=1)
-    ipu_runner = build_runner(cfg, default_args=default_args)
-    assert ipu_runner._max_iters == 1
-    runner.IS_IPU_AVAILABLE = False
-    cfg = dict(type='IPUIterBasedRunner', max_iters=1)
-    with pytest.raises(
-            NotImplementedError,
-            match='cpu mode on IPURunner is not supported'):
-        ipu_runner = build_runner(cfg, default_args=default_args)
-    runner.IS_IPU_AVAILABLE = True
-    with pytest.raises(ValueError, match='Only one of'):
-        cfg = dict(type='IPUIterBasedRunner', max_epochs=1, max_iters=1)
-        ipu_runner = build_runner(cfg, default_args=default_args)
-    model = ToyModel()
-    options_cfg = {'train_cfg': {}, 'eval_cfg': {}}
-    dataloader = IPUDataLoader(ToyDataset(), None, num_workers=1)
-    optimizer = torch.optim.SGD(model.parameters(), lr=0.1)
-    cfg = dict(type='IPUIterBasedRunner', max_iters=2, options_cfg=options_cfg)
-    default_args = dict(
-        model=model,
-        optimizer=optimizer,
-        work_dir=osp.join(tmp_path, dir_name),
-        logger=logging.getLogger())
-    ipu_runner = build_runner(cfg, default_args=default_args)
-    ipu_runner.run([dataloader], [('train', 2)])
-    ipu_runner.get_options('val')
-    with pytest.raises(ValueError, match='mode should be train or val'):
-        ipu_runner.get_options('666')
--- a/tests/test_device/test_ipu/test_ipu_utils.py
+++ b/tests/test_device/test_ipu/test_ipu_utils.py
-# Copyright (c) OpenMMLab. All rights reserved.
-import copy
-import pytest
-import torch.nn as nn
-import mmcv
-from mmcv.utils import IS_IPU_AVAILABLE
-if IS_IPU_AVAILABLE:
-    from poptorch.options import _IExecutionStrategy
-    from mmcv.device.ipu import cfg2options
-    from mmcv.device.ipu.utils import (build_from_cfg_with_wrapper,
-                                       model_sharding)
-skip_no_ipu = pytest.mark.skipif(
-    not IS_IPU_AVAILABLE, reason='test case under ipu environment')
-class ToyModel(nn.Module):
-    def __init__(self):
-        super().__init__()
-        self.conv = nn.Conv2d(3, 3, 1)
-        self.bn = nn.BatchNorm2d(3)
-        self.relu = nn.ReLU6()
-@skip_no_ipu
-def test_build_from_cfg():
-    BACKBONES = mmcv.Registry('backbone')
-    @BACKBONES.register_module()
-    class ResNet:
-        def __init__(self, depth, stages=4):
-            self.depth = depth
-            self.stages = stages
-    @BACKBONES.register_module()
-    class ResNeXt:
-        def __init__(self, depth, stages=4):
-            self.depth = depth
-            self.stages = stages
-    cfg = dict(type='ResNet', depth=50)
-    model = build_from_cfg_with_wrapper(cfg, BACKBONES)
-    assert isinstance(model, ResNet)
-    assert model.depth == 50 and model.stages == 4
-    cfg = dict(type='ResNet', depth=50)
-    model = build_from_cfg_with_wrapper(
-        cfg, BACKBONES, default_args={'stages': 3})
-    assert isinstance(model, ResNet)
-    assert model.depth == 50 and model.stages == 3
-    cfg = dict(type='ResNeXt', depth=50, stages=3)
-    model = build_from_cfg_with_wrapper(cfg, BACKBONES)
-    assert isinstance(model, ResNeXt)
-    assert model.depth == 50 and model.stages == 3
-    cfg = dict(type=ResNet, depth=50)
-    model = build_from_cfg_with_wrapper(cfg, BACKBONES)
-    assert isinstance(model, ResNet)
-    assert model.depth == 50 and model.stages == 4
-    # type defined using default_args
-    cfg = dict(depth=50)
-    model = build_from_cfg_with_wrapper(
-        cfg, BACKBONES, default_args=dict(type='ResNet'))
-    assert isinstance(model, ResNet)
-    assert model.depth == 50 and model.stages == 4
-    cfg = dict(depth=50)
-    model = build_from_cfg_with_wrapper(
-        cfg, BACKBONES, default_args=dict(type=ResNet))
-    assert isinstance(model, ResNet)
-    assert model.depth == 50 and model.stages == 4
-    # not a registry
-    with pytest.raises(TypeError):
-        cfg = dict(type='VGG')
-        model = build_from_cfg_with_wrapper(cfg, 'BACKBONES')
-    # non-registered class
-    with pytest.raises(KeyError):
-        cfg = dict(type='VGG')
-        model = build_from_cfg_with_wrapper(cfg, BACKBONES)
-    # default_args must be a dict or None
-    with pytest.raises(TypeError):
-        cfg = dict(type='ResNet', depth=50)
-        model = build_from_cfg_with_wrapper(cfg, BACKBONES, default_args=1)
-    # cfg['type'] should be a str or class
-    with pytest.raises(TypeError):
-        cfg = dict(type=1000)
-        model = build_from_cfg_with_wrapper(cfg, BACKBONES)
-    # cfg should contain the key "type"
-    with pytest.raises(KeyError, match='must contain the key "type"'):
-        cfg = dict(depth=50, stages=4)
-        model = build_from_cfg_with_wrapper(cfg, BACKBONES)
-    # cfg or default_args should contain the key "type"
-    with pytest.raises(KeyError, match='must contain the key "type"'):
-        cfg = dict(depth=50)
-        model = build_from_cfg_with_wrapper(
-            cfg, BACKBONES, default_args=dict(stages=4))
-    # incorrect registry type
-    with pytest.raises(TypeError):
-        cfg = dict(type='ResNet', depth=50)
-        model = build_from_cfg_with_wrapper(cfg, 'BACKBONES')
-    # incorrect default_args type
-    with pytest.raises(TypeError):
-        cfg = dict(type='ResNet', depth=50)
-        model = build_from_cfg_with_wrapper(cfg, BACKBONES, default_args=0)
-    # incorrect arguments
-    with pytest.raises(TypeError):
-        cfg = dict(type='ResNet', non_existing_arg=50)
-        model = build_from_cfg_with_wrapper(cfg, BACKBONES)
-    # cfg not dict
-    with pytest.raises(TypeError):
-        cfg = []
-        model = build_from_cfg_with_wrapper(cfg, BACKBONES)
-@skip_no_ipu
-def test_cast_to_options():
-    options_cfg = dict(
-        randomSeed=888,
-        enableExecutableCaching='cache_engine',
-        train_cfg=dict(
-            executionStrategy='SameAsIpu',
-            Training=dict(gradientAccumulation=8),
-            availableMemoryProportion=[0.3, 0.3, 0.3, 0.3],
-        ),
-        eval_cfg=dict(deviceIterations=1, ),
-    )
-    ipu_options = cfg2options(copy.deepcopy(options_cfg))
-    assert 'training' in ipu_options
-    assert 'inference' in ipu_options
-    assert ipu_options['training']._values['random_seed'] == 888
-    assert ipu_options['training']._values['replication_factor'] == 1
-    assert ipu_options['training']._values['available_memory_proportion'] == {
-        0: 0.3,
-        1: 0.3,
-        2: 0.3,
-        3: 0.3
-    }
-    assert ipu_options['training']._popart.options[
-        'cachePath'] == 'cache_engine'
-    assert isinstance(ipu_options['training']._execution_strategy,
-                      _IExecutionStrategy)
-    assert ipu_options['inference']._values['device_iterations'] == 1
-    with pytest.raises(NotImplementedError, match='cfg type'):
-        _options_cfg = copy.deepcopy(options_cfg)
-        _options_cfg['randomSeed'] = (1, 3)
-        cfg2options(_options_cfg)
-    with pytest.raises(NotImplementedError, match='options_node type'):
-        _options_cfg = copy.deepcopy(options_cfg)
-        _options_cfg['train_cfg']['Precision'] = {'autocast_policy': 123}
-        cfg2options(_options_cfg)
-@skip_no_ipu
-def test_model_sharding():
-    model = ToyModel()
-    split_edges = [dict(layer_to_call='666', ipu_id=0)]
-    with pytest.raises(RuntimeError, match='split_edges:'):
-        model_sharding(model, split_edges)
-    model = ToyModel()
-    split_edges = [
-        dict(layer_to_call='conv', ipu_id=0),
-        dict(layer_to_call=1, ipu_id=0)
-    ]
-    with pytest.raises(ValueError, match='The same layer is referenced'):
-        model_sharding(model, split_edges)
-    model = ToyModel()
-    split_edges = [dict(layer_to_call='conv', ipu_id=0)]
-    model_sharding(model, split_edges)
--- a/tests/test_device/test_mlu/test_mlu_parallel.py
+++ b/tests/test_device/test_mlu/test_mlu_parallel.py
-# Copyright (c) OpenMMLab. All rights reserved.
-from unittest.mock import MagicMock, patch
-import torch.nn as nn
-from mmcv.device.mlu import MLUDataParallel, MLUDistributedDataParallel
-from mmcv.parallel import is_module_wrapper
-from mmcv.utils import IS_MLU_AVAILABLE
-def mock(*args, **kwargs):
-    pass
-@patch('torch.distributed._broadcast_coalesced', mock)
-@patch('torch.distributed.broadcast', mock)
-@patch('torch.nn.parallel.DistributedDataParallel._ddp_init_helper', mock)
-def test_is_module_wrapper():
-    class Model(nn.Module):
-        def __init__(self):
-            super().__init__()
-            self.conv = nn.Conv2d(2, 2, 1)
-        def forward(self, x):
-            return self.conv(x)
-    model = Model()
-    assert not is_module_wrapper(model)
-    if IS_MLU_AVAILABLE:
-        mludp = MLUDataParallel(model)
-        assert is_module_wrapper(mludp)
-        mluddp = MLUDistributedDataParallel(model, process_group=MagicMock())
-        assert is_module_wrapper(mluddp)
--- a/tests/test_device/test_mps/test_mps_parallel.py
+++ b/tests/test_device/test_mps/test_mps_parallel.py
-# Copyright (c) OpenMMLab. All rights reserved.
-from unittest.mock import patch
-import torch.nn as nn
-from mmcv.device.mps import MPSDataParallel
-from mmcv.parallel import is_module_wrapper
-from mmcv.utils import IS_MPS_AVAILABLE
-def mock(*args, **kwargs):
-    pass
-@patch('torch.distributed._broadcast_coalesced', mock)
-@patch('torch.distributed.broadcast', mock)
-@patch('torch.nn.parallel.DistributedDataParallel._ddp_init_helper', mock)
-def test_is_module_wrapper():
-    class Model(nn.Module):
-        def __init__(self):
-            super().__init__()
-            self.conv = nn.Conv2d(2, 2, 1)
-        def forward(self, x):
-            return self.conv(x)
-    model = Model()
-    assert not is_module_wrapper(model)
-    if IS_MPS_AVAILABLE:
-        mpsdp = MPSDataParallel(model)
-        assert is_module_wrapper(mpsdp)
--- a/tests/test_load_model_zoo.py
+++ b/tests/test_load_model_zoo.py
-# Copyright (c) OpenMMLab. All rights reserved.
-import os
-import os.path as osp
-from unittest.mock import patch
-import mmengine
-import pytest
-import torchvision
-import mmcv
-from mmcv.runner.checkpoint import (DEFAULT_CACHE_DIR, ENV_MMCV_HOME,
-                                    ENV_XDG_CACHE_HOME, _get_mmcv_home,
-                                    _load_checkpoint,
-                                    get_deprecated_model_names,
-                                    get_external_models)
-from mmcv.utils import digit_version
-@patch('mmcv.__path__', [osp.join(osp.dirname(__file__), 'data/')])
-def test_set_mmcv_home():
-    os.environ.pop(ENV_MMCV_HOME, None)
-    mmcv_home = osp.join(osp.dirname(__file__), 'data/model_zoo/mmcv_home/')
-    os.environ[ENV_MMCV_HOME] = mmcv_home
-    assert _get_mmcv_home() == mmcv_home
-@patch('mmcv.__path__', [osp.join(osp.dirname(__file__), 'data/')])
-def test_default_mmcv_home():
-    os.environ.pop(ENV_MMCV_HOME, None)
-    os.environ.pop(ENV_XDG_CACHE_HOME, None)
-    assert _get_mmcv_home() == os.path.expanduser(
-        os.path.join(DEFAULT_CACHE_DIR, 'mmcv'))
-    model_urls = get_external_models()
-    assert model_urls == mmengine.load(
-        osp.join(mmcv.__path__[0], 'model_zoo/open_mmlab.json'))
-@patch('mmcv.__path__', [osp.join(osp.dirname(__file__), 'data/')])
-def test_get_external_models():
-    os.environ.pop(ENV_MMCV_HOME, None)
-    mmcv_home = osp.join(osp.dirname(__file__), 'data/model_zoo/mmcv_home/')
-    os.environ[ENV_MMCV_HOME] = mmcv_home
-    ext_urls = get_external_models()
-    assert ext_urls == {
-        'train': 'https://localhost/train.pth',
-        'test': 'test.pth',
-        'val': 'val.pth',
-        'train_empty': 'train.pth'
-    }
-@patch('mmcv.__path__', [osp.join(osp.dirname(__file__), 'data/')])
-def test_get_deprecated_models():
-    os.environ.pop(ENV_MMCV_HOME, None)
-    mmcv_home = osp.join(osp.dirname(__file__), 'data/model_zoo/mmcv_home/')
-    os.environ[ENV_MMCV_HOME] = mmcv_home
-    dep_urls = get_deprecated_model_names()
-    assert dep_urls == {
-        'train_old': 'train',
-        'test_old': 'test',
-    }
-def load_from_http(url, map_location=None):
-    return 'url:' + url
-def load_url(url, map_location=None, model_dir=None):
-    return load_from_http(url)
-def load(filepath, map_location=None):
-    return 'local:' + filepath
-@patch('mmcv.__path__', [osp.join(osp.dirname(__file__), 'data/')])
-@patch('mmcv.runner.checkpoint.load_from_http', load_from_http)
-@patch('mmcv.runner.checkpoint.load_url', load_url)
-@patch('torch.load', load)
-def test_load_external_url():
-    # test modelzoo://
-    torchvision_version = torchvision.__version__
-    if digit_version(torchvision_version) < digit_version('0.10.0a0'):
-        assert (_load_checkpoint('modelzoo://resnet50') ==
-                'url:https://download.pytorch.org/models/resnet50-19c8e'
-                '357.pth')
-        assert (_load_checkpoint('torchvision://resnet50') ==
-                'url:https://download.pytorch.org/models/resnet50-19c8e'
-                '357.pth')
-    else:
-        assert (_load_checkpoint('modelzoo://resnet50') ==
-                'url:https://download.pytorch.org/models/resnet50-0676b'
-                'a61.pth')
-        assert (_load_checkpoint('torchvision://resnet50') ==
-                'url:https://download.pytorch.org/models/resnet50-0676b'
-                'a61.pth')
-    if digit_version(torchvision_version) >= digit_version('0.13.0a0'):
-        # Test load new format torchvision models.
-        assert (
-            _load_checkpoint('torchvision://resnet50.imagenet1k_v1') ==
-            'url:https://download.pytorch.org/models/resnet50-0676ba61.pth')
-        assert (
-            _load_checkpoint('torchvision://ResNet50_Weights.IMAGENET1K_V1') ==
-            'url:https://download.pytorch.org/models/resnet50-0676ba61.pth')
-        _load_checkpoint('torchvision://resnet50.default')
-    # test open-mmlab:// with default MMCV_HOME
-    os.environ.pop(ENV_MMCV_HOME, None)
-    os.environ.pop(ENV_XDG_CACHE_HOME, None)
-    url = _load_checkpoint('open-mmlab://train')
-    assert url == 'url:https://localhost/train.pth'
-    # test open-mmlab:// with deprecated model name
-    os.environ.pop(ENV_MMCV_HOME, None)
-    os.environ.pop(ENV_XDG_CACHE_HOME, None)
-    with pytest.warns(
-            Warning,
-            match='open-mmlab://train_old is deprecated in favor of '
-            'open-mmlab://train'):
-        url = _load_checkpoint('open-mmlab://train_old')
-        assert url == 'url:https://localhost/train.pth'
-    # test openmmlab:// with deprecated model name
-    os.environ.pop(ENV_MMCV_HOME, None)
-    os.environ.pop(ENV_XDG_CACHE_HOME, None)
-    with pytest.warns(
-            Warning,
-            match='openmmlab://train_old is deprecated in favor of '
-            'openmmlab://train'):
-        url = _load_checkpoint('openmmlab://train_old')
-        assert url == 'url:https://localhost/train.pth'
-    # test open-mmlab:// with user-defined MMCV_HOME
-    os.environ.pop(ENV_MMCV_HOME, None)
-    mmcv_home = osp.join(osp.dirname(__file__), 'data/model_zoo/mmcv_home')
-    os.environ[ENV_MMCV_HOME] = mmcv_home
-    url = _load_checkpoint('open-mmlab://train')
-    assert url == 'url:https://localhost/train.pth'
-    with pytest.raises(FileNotFoundError, match='train.pth can not be found.'):
-        _load_checkpoint('open-mmlab://train_empty')
-    url = _load_checkpoint('open-mmlab://test')
-    assert url == f'local:{osp.join(_get_mmcv_home(), "test.pth")}'
-    url = _load_checkpoint('open-mmlab://val')
-    assert url == f'local:{osp.join(_get_mmcv_home(), "val.pth")}'
-    # test http:// https://
-    url = _load_checkpoint('http://localhost/train.pth')
-    assert url == 'url:http://localhost/train.pth'
-    # test local file
-    with pytest.raises(FileNotFoundError, match='train.pth can not be found.'):
-        _load_checkpoint('train.pth')
-    url = _load_checkpoint(osp.join(_get_mmcv_home(), 'test.pth'))
-    assert url == f'local:{osp.join(_get_mmcv_home(), "test.pth")}'
--- a/tests/test_parallel.py
+++ b/tests/test_parallel.py
-# Copyright (c) OpenMMLab. All rights reserved.
-from unittest.mock import MagicMock, patch
-import pytest
-import torch
-import torch.nn as nn
-from torch.nn.parallel import DataParallel, DistributedDataParallel
-from mmcv.parallel import (MODULE_WRAPPERS, MMDataParallel,
-                           MMDistributedDataParallel, is_module_wrapper)
-from mmcv.parallel._functions import Scatter, get_input_device, scatter
-from mmcv.parallel.distributed_deprecated import \
-    MMDistributedDataParallel as DeprecatedMMDDP
-from mmcv.utils import Registry
-def mock(*args, **kwargs):
-    pass
-@pytest.mark.skipif(
-    torch.__version__ == 'parrots', reason='not supported in parrots now')
-@patch('torch.distributed._broadcast_coalesced', mock)
-@patch('torch.distributed.broadcast', mock)
-@patch('torch.nn.parallel.DistributedDataParallel._ddp_init_helper', mock)
-def test_is_module_wrapper():
-    class Model(nn.Module):
-        def __init__(self):
-            super().__init__()
-            self.conv = nn.Conv2d(2, 2, 1)
-        def forward(self, x):
-            return self.conv(x)
-    # _verify_model_across_ranks is added in torch1.9.0,
-    # _verify_params_across_processes is added in torch1.11.0,
-    # so we should check whether _verify_model_across_ranks
-    # and _verify_params_across_processes are the member of
-    # torch.distributed before mocking
-    if hasattr(torch.distributed, '_verify_model_across_ranks'):
-        torch.distributed._verify_model_across_ranks = mock
-    if hasattr(torch.distributed, '_verify_params_across_processes'):
-        torch.distributed._verify_params_across_processes = mock
-    model = Model()
-    assert not is_module_wrapper(model)
-    dp = DataParallel(model)
-    assert is_module_wrapper(dp)
-    mmdp = MMDataParallel(model)
-    assert is_module_wrapper(mmdp)
-    ddp = DistributedDataParallel(model, process_group=MagicMock())
-    assert is_module_wrapper(ddp)
-    mmddp = MMDistributedDataParallel(model, process_group=MagicMock())
-    assert is_module_wrapper(mmddp)
-    deprecated_mmddp = DeprecatedMMDDP(model)
-    assert is_module_wrapper(deprecated_mmddp)
-    # test module wrapper registry
-    @MODULE_WRAPPERS.register_module()
-    class ModuleWrapper:
-        def __init__(self, module):
-            self.module = module
-        def forward(self, *args, **kwargs):
-            return self.module(*args, **kwargs)
-    module_wraper = ModuleWrapper(model)
-    assert is_module_wrapper(module_wraper)
-    # test module wrapper registry in downstream repo
-    MMRAZOR_MODULE_WRAPPERS = Registry(
-        'mmrazor module wrapper', parent=MODULE_WRAPPERS, scope='mmrazor')
-    MMPOSE_MODULE_WRAPPERS = Registry(
-        'mmpose module wrapper', parent=MODULE_WRAPPERS, scope='mmpose')
-    @MMRAZOR_MODULE_WRAPPERS.register_module()
-    class ModuleWrapperInRazor:
-        def __init__(self, module):
-            self.module = module
-        def forward(self, *args, **kwargs):
-            return self.module(*args, **kwargs)
-    @MMPOSE_MODULE_WRAPPERS.register_module()
-    class ModuleWrapperInPose:
-        def __init__(self, module):
-            self.module = module
-        def forward(self, *args, **kwargs):
-            return self.module(*args, **kwargs)
-    wrapped_module = ModuleWrapperInRazor(model)
-    assert is_module_wrapper(wrapped_module)
-    wrapped_module = ModuleWrapperInPose(model)
-    assert is_module_wrapper(wrapped_module)
-def test_get_input_device():
-    # if the device is CPU, return -1
-    input = torch.zeros([1, 3, 3, 3])
-    assert get_input_device(input) == -1
-    inputs = [torch.zeros([1, 3, 3, 3]), torch.zeros([1, 4, 4, 4])]
-    assert get_input_device(inputs) == -1
-    # if the device is GPU, return the index of device
-    if torch.cuda.is_available():
-        input = torch.zeros([1, 3, 3, 3]).cuda()
-        assert get_input_device(input) == 0
-        inputs = [
-            torch.zeros([1, 3, 3, 3]).cuda(),
-            torch.zeros([1, 4, 4, 4]).cuda()
-        ]
-        assert get_input_device(inputs) == 0
-    # input should be a tensor or list of tensor
-    with pytest.raises(Exception):
-        get_input_device(5)
-def test_scatter():
-    # if the device is CPU, just return the input
-    input = torch.zeros([1, 3, 3, 3])
-    output = scatter(input=input, devices=[-1])
-    assert torch.allclose(input, output)
-    inputs = [torch.zeros([1, 3, 3, 3]), torch.zeros([1, 4, 4, 4])]
-    outputs = scatter(input=inputs, devices=[-1])
-    for input, output in zip(inputs, outputs):
-        assert torch.allclose(input, output)
-    # if the device is GPU, copy the input from CPU to GPU
-    if torch.cuda.is_available():
-        input = torch.zeros([1, 3, 3, 3])
-        output = scatter(input=input, devices=[0])
-        assert torch.allclose(input.cuda(), output)
-        inputs = [torch.zeros([1, 3, 3, 3]), torch.zeros([1, 4, 4, 4])]
-        outputs = scatter(input=inputs, devices=[0])
-        for input, output in zip(inputs, outputs):
-            assert torch.allclose(input.cuda(), output)
-    # input should be a tensor or list of tensor
-    with pytest.raises(Exception):
-        scatter(5, [-1])
-@pytest.mark.skipif(
-    torch.__version__ == 'parrots', reason='not supported in parrots now')
-def test_Scatter():
-    # if the device is CPU, just return the input
-    target_gpus = [-1]
-    input = torch.zeros([1, 3, 3, 3])
-    outputs = Scatter.forward(target_gpus, input)
-    assert isinstance(outputs, tuple)
-    assert torch.allclose(input, outputs[0])
-    target_gpus = [-1]
-    inputs = [torch.zeros([1, 3, 3, 3]), torch.zeros([1, 4, 4, 4])]
-    outputs = Scatter.forward(target_gpus, inputs)
-    assert isinstance(outputs, tuple)
-    for input, output in zip(inputs, outputs):
-        assert torch.allclose(input, output)
-    # if the device is GPU, copy the input from CPU to GPU
-    if torch.cuda.is_available():
-        target_gpus = [0]
-        input = torch.zeros([1, 3, 3, 3])
-        outputs = Scatter.forward(target_gpus, input)
-        assert isinstance(outputs, tuple)
-        assert torch.allclose(input.cuda(), outputs[0])
-        target_gpus = [0]
-        inputs = [torch.zeros([1, 3, 3, 3]), torch.zeros([1, 4, 4, 4])]
-        outputs = Scatter.forward(target_gpus, inputs)
-        assert isinstance(outputs, tuple)
-        for input, output in zip(inputs, outputs):
-            assert torch.allclose(input.cuda(), output[0])
--- a/tests/test_runner/test_checkpoint.py
+++ b/tests/test_runner/test_checkpoint.py
-# Copyright (c) OpenMMLab. All rights reserved.
-import sys
-from collections import OrderedDict
-from tempfile import TemporaryDirectory
-from unittest.mock import MagicMock, patch
-import pytest
-import torch
-import torch.nn as nn
-import torch.optim as optim
-from mmengine.fileio.file_client import PetrelBackend
-from torch.nn.parallel import DataParallel
-from mmcv.parallel.registry import MODULE_WRAPPERS
-from mmcv.runner.checkpoint import (_load_checkpoint_with_prefix,
-                                    get_state_dict, load_checkpoint,
-                                    load_from_local, load_from_pavi,
-                                    save_checkpoint)
-sys.modules['petrel_client'] = MagicMock()
-sys.modules['petrel_client.client'] = MagicMock()
-@MODULE_WRAPPERS.register_module()
-class DDPWrapper:
-    def __init__(self, module):
-        self.module = module
-class Block(nn.Module):
-    def __init__(self):
-        super().__init__()
-        self.conv = nn.Conv2d(3, 3, 1)
-        self.norm = nn.BatchNorm2d(3)
-class Model(nn.Module):
-    def __init__(self):
-        super().__init__()
-        self.block = Block()
-        self.conv = nn.Conv2d(3, 3, 1)
-class Mockpavimodel:
-    def __init__(self, name='fakename'):
-        self.name = name
-    def download(self, file):
-        pass
-def assert_tensor_equal(tensor_a, tensor_b):
-    assert tensor_a.eq(tensor_b).all()
-def test_get_state_dict():
-    if torch.__version__ == 'parrots':
-        state_dict_keys = {
-            'block.conv.weight', 'block.conv.bias', 'block.norm.weight',
-            'block.norm.bias', 'block.norm.running_mean',
-            'block.norm.running_var', 'conv.weight', 'conv.bias'
-        }
-    else:
-        state_dict_keys = {
-            'block.conv.weight', 'block.conv.bias', 'block.norm.weight',
-            'block.norm.bias', 'block.norm.running_mean',
-            'block.norm.running_var', 'block.norm.num_batches_tracked',
-            'conv.weight', 'conv.bias'
-        }
-    model = Model()
-    state_dict = get_state_dict(model)
-    assert isinstance(state_dict, OrderedDict)
-    assert set(state_dict.keys()) == state_dict_keys
-    assert_tensor_equal(state_dict['block.conv.weight'],
-                        model.block.conv.weight)
-    assert_tensor_equal(state_dict['block.conv.bias'], model.block.conv.bias)
-    assert_tensor_equal(state_dict['block.norm.weight'],
-                        model.block.norm.weight)
-    assert_tensor_equal(state_dict['block.norm.bias'], model.block.norm.bias)
-    assert_tensor_equal(state_dict['block.norm.running_mean'],
-                        model.block.norm.running_mean)
-    assert_tensor_equal(state_dict['block.norm.running_var'],
-                        model.block.norm.running_var)
-    if torch.__version__ != 'parrots':
-        assert_tensor_equal(state_dict['block.norm.num_batches_tracked'],
-                            model.block.norm.num_batches_tracked)
-    assert_tensor_equal(state_dict['conv.weight'], model.conv.weight)
-    assert_tensor_equal(state_dict['conv.bias'], model.conv.bias)
-    wrapped_model = DDPWrapper(model)
-    state_dict = get_state_dict(wrapped_model)
-    assert isinstance(state_dict, OrderedDict)
-    assert set(state_dict.keys()) == state_dict_keys
-    assert_tensor_equal(state_dict['block.conv.weight'],
-                        wrapped_model.module.block.conv.weight)
-    assert_tensor_equal(state_dict['block.conv.bias'],
-                        wrapped_model.module.block.conv.bias)
-    assert_tensor_equal(state_dict['block.norm.weight'],
-                        wrapped_model.module.block.norm.weight)
-    assert_tensor_equal(state_dict['block.norm.bias'],
-                        wrapped_model.module.block.norm.bias)
-    assert_tensor_equal(state_dict['block.norm.running_mean'],
-                        wrapped_model.module.block.norm.running_mean)
-    assert_tensor_equal(state_dict['block.norm.running_var'],
-                        wrapped_model.module.block.norm.running_var)
-    if torch.__version__ != 'parrots':
-        assert_tensor_equal(
-            state_dict['block.norm.num_batches_tracked'],
-            wrapped_model.module.block.norm.num_batches_tracked)
-    assert_tensor_equal(state_dict['conv.weight'],
-                        wrapped_model.module.conv.weight)
-    assert_tensor_equal(state_dict['conv.bias'],
-                        wrapped_model.module.conv.bias)
-    # wrapped inner module
-    for name, module in wrapped_model.module._modules.items():
-        module = DataParallel(module)
-        wrapped_model.module._modules[name] = module
-    state_dict = get_state_dict(wrapped_model)
-    assert isinstance(state_dict, OrderedDict)
-    assert set(state_dict.keys()) == state_dict_keys
-    assert_tensor_equal(state_dict['block.conv.weight'],
-                        wrapped_model.module.block.module.conv.weight)
-    assert_tensor_equal(state_dict['block.conv.bias'],
-                        wrapped_model.module.block.module.conv.bias)
-    assert_tensor_equal(state_dict['block.norm.weight'],
-                        wrapped_model.module.block.module.norm.weight)
-    assert_tensor_equal(state_dict['block.norm.bias'],
-                        wrapped_model.module.block.module.norm.bias)
-    assert_tensor_equal(state_dict['block.norm.running_mean'],
-                        wrapped_model.module.block.module.norm.running_mean)
-    assert_tensor_equal(state_dict['block.norm.running_var'],
-                        wrapped_model.module.block.module.norm.running_var)
-    if torch.__version__ != 'parrots':
-        assert_tensor_equal(
-            state_dict['block.norm.num_batches_tracked'],
-            wrapped_model.module.block.module.norm.num_batches_tracked)
-    assert_tensor_equal(state_dict['conv.weight'],
-                        wrapped_model.module.conv.module.weight)
-    assert_tensor_equal(state_dict['conv.bias'],
-                        wrapped_model.module.conv.module.bias)
-def test_load_pavimodel_dist():
-    sys.modules['pavi'] = MagicMock()
-    sys.modules['pavi.modelcloud'] = MagicMock()
-    pavimodel = Mockpavimodel()
-    import pavi
-    pavi.modelcloud.get = MagicMock(return_value=pavimodel)
-    with pytest.raises(AssertionError):
-        # test pavi prefix
-        _ = load_from_pavi('MyPaviFolder/checkpoint.pth')
-    with pytest.raises(FileNotFoundError):
-        # there is not such checkpoint for us to load
-        _ = load_from_pavi('pavi://checkpoint.pth')
-def test_load_checkpoint_with_prefix():
-    class FooModule(nn.Module):
-        def __init__(self):
-            super().__init__()
-            self.linear = nn.Linear(1, 2)
-            self.conv2d = nn.Conv2d(3, 1, 3)
-            self.conv2d_2 = nn.Conv2d(3, 2, 3)
-    model = FooModule()
-    nn.init.constant_(model.linear.weight, 1)
-    nn.init.constant_(model.linear.bias, 2)
-    nn.init.constant_(model.conv2d.weight, 3)
-    nn.init.constant_(model.conv2d.bias, 4)
-    nn.init.constant_(model.conv2d_2.weight, 5)
-    nn.init.constant_(model.conv2d_2.bias, 6)
-    with TemporaryDirectory():
-        torch.save(model.state_dict(), 'model.pth')
-        prefix = 'conv2d'
-        state_dict = _load_checkpoint_with_prefix(prefix, 'model.pth')
-        assert torch.equal(model.conv2d.state_dict()['weight'],
-                           state_dict['weight'])
-        assert torch.equal(model.conv2d.state_dict()['bias'],
-                           state_dict['bias'])
-        # test whether prefix is in pretrained model
-        with pytest.raises(AssertionError):
-            prefix = 'back'
-            _load_checkpoint_with_prefix(prefix, 'model.pth')
-def test_load_checkpoint():
-    import os
-    import re
-    import tempfile
-    class PrefixModel(nn.Module):
-        def __init__(self):
-            super().__init__()
-            self.backbone = Model()
-    pmodel = PrefixModel()
-    model = Model()
-    checkpoint_path = os.path.join(tempfile.gettempdir(), 'checkpoint.pth')
-    # add prefix
-    torch.save(model.state_dict(), checkpoint_path)
-    state_dict = load_checkpoint(
-        pmodel, checkpoint_path, revise_keys=[(r'^', 'backbone.')])
-    for key in pmodel.backbone.state_dict().keys():
-        assert torch.equal(pmodel.backbone.state_dict()[key], state_dict[key])
-    # strip prefix
-    torch.save(pmodel.state_dict(), checkpoint_path)
-    state_dict = load_checkpoint(
-        model, checkpoint_path, revise_keys=[(r'^backbone\.', '')])
-    for key in state_dict.keys():
-        key_stripped = re.sub(r'^backbone\.', '', key)
-        assert torch.equal(model.state_dict()[key_stripped], state_dict[key])
-    os.remove(checkpoint_path)
-def test_load_checkpoint_metadata():
-    import os
-    import tempfile
-    from mmcv.runner import load_checkpoint, save_checkpoint
-    class ModelV1(nn.Module):
-        def __init__(self):
-            super().__init__()
-            self.block = Block()
-            self.conv1 = nn.Conv2d(3, 3, 1)
-            self.conv2 = nn.Conv2d(3, 3, 1)
-            nn.init.normal_(self.conv1.weight)
-            nn.init.normal_(self.conv2.weight)
-    class ModelV2(nn.Module):
-        _version = 2
-        def __init__(self):
-            super().__init__()
-            self.block = Block()
-            self.conv0 = nn.Conv2d(3, 3, 1)
-            self.conv1 = nn.Conv2d(3, 3, 1)
-            nn.init.normal_(self.conv0.weight)
-            nn.init.normal_(self.conv1.weight)
-        def _load_from_state_dict(self, state_dict, prefix, local_metadata,
-                                  *args, **kwargs):
-            """load checkpoints."""
-            # Names of some parameters in has been changed.
-            version = local_metadata.get('version', None)
-            if version is None or version < 2:
-                state_dict_keys = list(state_dict.keys())
-                convert_map = {'conv1': 'conv0', 'conv2': 'conv1'}
-                for k in state_dict_keys:
-                    for ori_str, new_str in convert_map.items():
-                        if k.startswith(prefix + ori_str):
-                            new_key = k.replace(ori_str, new_str)
-                            state_dict[new_key] = state_dict[k]
-                            del state_dict[k]
-            super()._load_from_state_dict(state_dict, prefix, local_metadata,
-                                          *args, **kwargs)
-    model_v1 = ModelV1()
-    model_v1_conv0_weight = model_v1.conv1.weight.detach()
-    model_v1_conv1_weight = model_v1.conv2.weight.detach()
-    model_v2 = ModelV2()
-    model_v2_conv0_weight = model_v2.conv0.weight.detach()
-    model_v2_conv1_weight = model_v2.conv1.weight.detach()
-    ckpt_v1_path = os.path.join(tempfile.gettempdir(), 'checkpoint_v1.pth')
-    ckpt_v2_path = os.path.join(tempfile.gettempdir(), 'checkpoint_v2.pth')
-    # Save checkpoint
-    save_checkpoint(model_v1, ckpt_v1_path)
-    save_checkpoint(model_v2, ckpt_v2_path)
-    # test load v1 model
-    load_checkpoint(model_v2, ckpt_v1_path)
-    assert torch.allclose(model_v2.conv0.weight, model_v1_conv0_weight)
-    assert torch.allclose(model_v2.conv1.weight, model_v1_conv1_weight)
-    # test load v2 model
-    load_checkpoint(model_v2, ckpt_v2_path)
-    assert torch.allclose(model_v2.conv0.weight, model_v2_conv0_weight)
-    assert torch.allclose(model_v2.conv1.weight, model_v2_conv1_weight)
-def test_load_classes_name():
-    import os
-    import tempfile
-    from mmcv.runner import load_checkpoint, save_checkpoint
-    checkpoint_path = os.path.join(tempfile.gettempdir(), 'checkpoint.pth')
-    model = Model()
-    save_checkpoint(model, checkpoint_path)
-    checkpoint = load_checkpoint(model, checkpoint_path)
-    assert 'meta' in checkpoint and 'CLASSES' not in checkpoint['meta']
-    model.CLASSES = ('class1', 'class2')
-    save_checkpoint(model, checkpoint_path)
-    checkpoint = load_checkpoint(model, checkpoint_path)
-    assert 'meta' in checkpoint and 'CLASSES' in checkpoint['meta']
-    assert checkpoint['meta']['CLASSES'] == ('class1', 'class2')
-    model = Model()
-    wrapped_model = DDPWrapper(model)
-    save_checkpoint(wrapped_model, checkpoint_path)
-    checkpoint = load_checkpoint(wrapped_model, checkpoint_path)
-    assert 'meta' in checkpoint and 'CLASSES' not in checkpoint['meta']
-    wrapped_model.module.CLASSES = ('class1', 'class2')
-    save_checkpoint(wrapped_model, checkpoint_path)
-    checkpoint = load_checkpoint(wrapped_model, checkpoint_path)
-    assert 'meta' in checkpoint and 'CLASSES' in checkpoint['meta']
-    assert checkpoint['meta']['CLASSES'] == ('class1', 'class2')
-    # remove the temp file
-    os.remove(checkpoint_path)
-def test_checkpoint_loader():
-    import os
-    import tempfile
-    from mmcv.runner import CheckpointLoader, _load_checkpoint, save_checkpoint
-    checkpoint_path = os.path.join(tempfile.gettempdir(), 'checkpoint.pth')
-    model = Model()
-    save_checkpoint(model, checkpoint_path)
-    checkpoint = _load_checkpoint(checkpoint_path)
-    assert 'meta' in checkpoint and 'CLASSES' not in checkpoint['meta']
-    # remove the temp file
-    os.remove(checkpoint_path)
-    filenames = [
-        'http://xx.xx/xx.pth', 'https://xx.xx/xx.pth',
-        'modelzoo://xx.xx/xx.pth', 'torchvision://xx.xx/xx.pth',
-        'open-mmlab://xx.xx/xx.pth', 'openmmlab://xx.xx/xx.pth',
-        'mmcls://xx.xx/xx.pth', 'pavi://xx.xx/xx.pth', 's3://xx.xx/xx.pth',
-        'ss3://xx.xx/xx.pth', ' s3://xx.xx/xx.pth',
-        'open-mmlab:s3://xx.xx/xx.pth', 'openmmlab:s3://xx.xx/xx.pth',
-        'openmmlabs3://xx.xx/xx.pth', ':s3://xx.xx/xx.path'
-    ]
-    fn_names = [
-        'load_from_http', 'load_from_http', 'load_from_torchvision',
-        'load_from_torchvision', 'load_from_openmmlab', 'load_from_openmmlab',
-        'load_from_mmcls', 'load_from_pavi', 'load_from_ceph',
-        'load_from_local', 'load_from_local', 'load_from_ceph',
-        'load_from_ceph', 'load_from_local', 'load_from_local'
-    ]
-    for filename, fn_name in zip(filenames, fn_names):
-        loader = CheckpointLoader._get_checkpoint_loader(filename)
-        assert loader.__name__ == fn_name
-    @CheckpointLoader.register_scheme(prefixes='ftp://')
-    def load_from_ftp(filename, map_location):
-        return dict(filename=filename)
-    # test register_loader
-    filename = 'ftp://xx.xx/xx.pth'
-    loader = CheckpointLoader._get_checkpoint_loader(filename)
-    assert loader.__name__ == 'load_from_ftp'
-    def load_from_ftp1(filename, map_location):
-        return dict(filename=filename)
-    # test duplicate registered error
-    with pytest.raises(KeyError):
-        CheckpointLoader.register_scheme('ftp://', load_from_ftp1)
-    # test force param
-    CheckpointLoader.register_scheme('ftp://', load_from_ftp1, force=True)
-    checkpoint = CheckpointLoader.load_checkpoint(filename)
-    assert checkpoint['filename'] == filename
-    # test print function name
-    loader = CheckpointLoader._get_checkpoint_loader(filename)
-    assert loader.__name__ == 'load_from_ftp1'
-    # test sort
-    @CheckpointLoader.register_scheme(prefixes='a/b')
-    def load_from_ab(filename, map_location):
-        return dict(filename=filename)
-    @CheckpointLoader.register_scheme(prefixes='a/b/c')
-    def load_from_abc(filename, map_location):
-        return dict(filename=filename)
-    filename = 'a/b/c/d'
-    loader = CheckpointLoader._get_checkpoint_loader(filename)
-    assert loader.__name__ == 'load_from_abc'
-def test_save_checkpoint(tmp_path):
-    model = Model()
-    optimizer = optim.SGD(model.parameters(), lr=0.1, momentum=0.9)
-    # meta is not a dict
-    with pytest.raises(TypeError):
-        save_checkpoint(model, '/path/of/your/filename', meta='invalid type')
-    # 1. save to disk
-    filename = str(tmp_path / 'checkpoint1.pth')
-    save_checkpoint(model, filename)
-    filename = str(tmp_path / 'checkpoint2.pth')
-    save_checkpoint(model, filename, optimizer)
-    filename = str(tmp_path / 'checkpoint3.pth')
-    save_checkpoint(model, filename, meta={'test': 'test'})
-    filename = str(tmp_path / 'checkpoint4.pth')
-    save_checkpoint(model, filename, file_client_args={'backend': 'disk'})
-    # 2. save to petrel oss
-    with patch.object(PetrelBackend, 'put') as mock_method:
-        filename = 's3://path/of/your/checkpoint1.pth'
-        save_checkpoint(model, filename)
-    mock_method.assert_called()
-    with patch.object(PetrelBackend, 'put') as mock_method:
-        filename = 's3://path//of/your/checkpoint2.pth'
-        save_checkpoint(
-            model, filename, file_client_args={'backend': 'petrel'})
-    mock_method.assert_called()
-def test_load_from_local():
-    import os
-    home_path = os.path.expanduser('~')
-    checkpoint_path = os.path.join(
-        home_path, 'dummy_checkpoint_used_to_test_load_from_local.pth')
-    model = Model()
-    save_checkpoint(model, checkpoint_path)
-    checkpoint = load_from_local(
-        '~/dummy_checkpoint_used_to_test_load_from_local.pth',
-        map_location=None)
-    assert_tensor_equal(checkpoint['state_dict']['block.conv.weight'],
-                        model.block.conv.weight)
-    os.remove(checkpoint_path)
--- a/tests/test_runner/test_dist_utils.py
+++ b/tests/test_runner/test_dist_utils.py
-# Copyright (c) OpenMMLab. All rights reserved.
-import os
-from unittest.mock import patch
-import pytest
-from mmcv.runner import init_dist
-@patch('torch.cuda.device_count', return_value=1)
-@patch('torch.cuda.set_device')
-@patch('torch.distributed.init_process_group')
-@patch('subprocess.getoutput', return_value='127.0.0.1')
-def test_init_dist(mock_getoutput, mock_dist_init, mock_set_device,
-                   mock_device_count):
-    with pytest.raises(ValueError):
-        # launcher must be one of {'pytorch', 'mpi', 'slurm'}
-        init_dist('invaliad_launcher')
-    # test initialize with slurm launcher
-    os.environ['SLURM_PROCID'] = '0'
-    os.environ['SLURM_NTASKS'] = '1'
-    os.environ['SLURM_NODELIST'] = '[0]'  # haven't check the correct form
-    init_dist('slurm')
-    # no port is specified, use default port 29500
-    assert os.environ['MASTER_PORT'] == '29500'
-    assert os.environ['MASTER_ADDR'] == '127.0.0.1'
-    assert os.environ['WORLD_SIZE'] == '1'
-    assert os.environ['RANK'] == '0'
-    mock_set_device.assert_called_with(0)
-    mock_getoutput.assert_called_with('scontrol show hostname [0] | head -n1')
-    mock_dist_init.assert_called_with(backend='nccl')
-    init_dist('slurm', port=29505)
-    # port is specified with argument 'port'
-    assert os.environ['MASTER_PORT'] == '29505'
-    assert os.environ['MASTER_ADDR'] == '127.0.0.1'
-    assert os.environ['WORLD_SIZE'] == '1'
-    assert os.environ['RANK'] == '0'
-    mock_set_device.assert_called_with(0)
-    mock_getoutput.assert_called_with('scontrol show hostname [0] | head -n1')
-    mock_dist_init.assert_called_with(backend='nccl')
-    init_dist('slurm')
-    # port is specified by environment variable 'MASTER_PORT'
-    assert os.environ['MASTER_PORT'] == '29505'
-    assert os.environ['MASTER_ADDR'] == '127.0.0.1'
-    assert os.environ['WORLD_SIZE'] == '1'
-    assert os.environ['RANK'] == '0'
-    mock_set_device.assert_called_with(0)
-    mock_getoutput.assert_called_with('scontrol show hostname [0] | head -n1')
-    mock_dist_init.assert_called_with(backend='nccl')
--- a/tests/test_runner/test_eval_hook.py
+++ b/tests/test_runner/test_eval_hook.py
-# Copyright (c) OpenMMLab. All rights reserved.
-import json
-import os.path as osp
-import sys
-import tempfile
-import unittest.mock as mock
-from collections import OrderedDict
-from unittest.mock import MagicMock, patch
-import pytest
-import torch
-import torch.nn as nn
-import torch.optim as optim
-from mmengine.fileio.file_client import PetrelBackend
-from torch.utils.data import DataLoader, Dataset
-from mmcv.runner import DistEvalHook as BaseDistEvalHook
-from mmcv.runner import EpochBasedRunner
-from mmcv.runner import EvalHook as BaseEvalHook
-from mmcv.runner import IterBasedRunner
-from mmcv.utils import get_logger, scandir
-sys.modules['petrel_client'] = MagicMock()
-sys.modules['petrel_client.client'] = MagicMock()
-class ExampleDataset(Dataset):
-    def __init__(self):
-        self.index = 0
-        self.eval_result = [1, 4, 3, 7, 2, -3, 4, 6]
-    def __getitem__(self, idx):
-        results = dict(x=torch.tensor([1]))
-        return results
-    def __len__(self):
-        return 1
-    @mock.create_autospec
-    def evaluate(self, results, logger=None):
-        pass
-class EvalDataset(ExampleDataset):
-    def evaluate(self, results, logger=None):
-        acc = self.eval_result[self.index]
-        output = OrderedDict(
-            acc=acc, index=self.index, score=acc, loss_top=acc)
-        self.index += 1
-        return output
-class Model(nn.Module):
-    def __init__(self):
-        super().__init__()
-        self.param = nn.Parameter(torch.tensor([1.0]))
-    def forward(self, x, **kwargs):
-        return self.param * x
-    def train_step(self, data_batch, optimizer, **kwargs):
-        return {'loss': torch.sum(self(data_batch['x']))}
-    def val_step(self, data_batch, optimizer, **kwargs):
-        return {'loss': torch.sum(self(data_batch['x']))}
-def _build_epoch_runner():
-    model = Model()
-    tmp_dir = tempfile.mkdtemp()
-    runner = EpochBasedRunner(
-        model=model, work_dir=tmp_dir, logger=get_logger('demo'))
-    return runner
-def _build_iter_runner():
-    model = Model()
-    tmp_dir = tempfile.mkdtemp()
-    runner = IterBasedRunner(
-        model=model, work_dir=tmp_dir, logger=get_logger('demo'))
-    return runner
-class EvalHook(BaseEvalHook):
-    _default_greater_keys = ['acc', 'top']
-    _default_less_keys = ['loss', 'loss_top']
-    def __init__(self, *args, **kwargs):
-        super().__init__(*args, **kwargs)
-class DistEvalHook(BaseDistEvalHook):
-    greater_keys = ['acc', 'top']
-    less_keys = ['loss', 'loss_top']
-    def __init__(self, *args, **kwargs):
-        super().__init__(*args, **kwargs)
-def test_eval_hook():
-    with pytest.raises(AssertionError):
-        # `save_best` should be a str
-        test_dataset = Model()
-        data_loader = DataLoader(test_dataset)
-        EvalHook(data_loader, save_best=True)
-    with pytest.raises(TypeError):
-        # dataloader must be a pytorch DataLoader
-        test_dataset = Model()
-        data_loader = [DataLoader(test_dataset)]
-        EvalHook(data_loader)
-    with pytest.raises(ValueError):
-        # key_indicator must be valid when rule_map is None
-        test_dataset = ExampleDataset()
-        data_loader = DataLoader(test_dataset)
-        EvalHook(data_loader, save_best='unsupport')
-    with pytest.raises(KeyError):
-        # rule must be in keys of rule_map
-        test_dataset = ExampleDataset()
-        data_loader = DataLoader(test_dataset)
-        EvalHook(data_loader, save_best='auto', rule='unsupport')
-    # if eval_res is an empty dict, print a warning information
-    with pytest.warns(UserWarning) as record_warnings:
-        class _EvalDataset(ExampleDataset):
-            def evaluate(self, results, logger=None):
-                return {}
-        test_dataset = _EvalDataset()
-        data_loader = DataLoader(test_dataset)
-        eval_hook = EvalHook(data_loader, save_best='auto')
-        runner = _build_epoch_runner()
-        runner.register_hook(eval_hook)
-        runner.run([data_loader], [('train', 1)], 1)
-    # Since there will be many warnings thrown, we just need to check if the
-    # expected exceptions are thrown
-    expected_message = ('Since `eval_res` is an empty dict, the behavior to '
-                        'save the best checkpoint will be skipped in this '
-                        'evaluation.')
-    for warning in record_warnings:
-        if str(warning.message) == expected_message:
-            break
-    else:
-        assert False
-    test_dataset = ExampleDataset()
-    loader = DataLoader(test_dataset)
-    model = Model()
-    data_loader = DataLoader(test_dataset)
-    eval_hook = EvalHook(data_loader, save_best=None)
-    with tempfile.TemporaryDirectory() as tmpdir:
-        # total_epochs = 1
-        logger = get_logger('test_eval')
-        runner = EpochBasedRunner(model=model, work_dir=tmpdir, logger=logger)
-        runner.register_hook(eval_hook)
-        runner.run([loader], [('train', 1)], 1)
-        test_dataset.evaluate.assert_called_with(
-            test_dataset, [torch.tensor([1])], logger=runner.logger)
-        assert runner.meta is None or 'best_score' not in runner.meta[
-            'hook_msgs']
-        assert runner.meta is None or 'best_ckpt' not in runner.meta[
-            'hook_msgs']
-    # when `save_best` is set to 'auto', first metric will be used.
-    loader = DataLoader(EvalDataset())
-    model = Model()
-    data_loader = DataLoader(EvalDataset())
-    eval_hook = EvalHook(data_loader, interval=1, save_best='auto')
-    with tempfile.TemporaryDirectory() as tmpdir:
-        logger = get_logger('test_eval')
-        runner = EpochBasedRunner(model=model, work_dir=tmpdir, logger=logger)
-        runner.register_checkpoint_hook(dict(interval=1))
-        runner.register_hook(eval_hook)
-        runner.run([loader], [('train', 1)], 8)
-        ckpt_path = osp.join(tmpdir, 'best_acc_epoch_4.pth')
-        assert runner.meta['hook_msgs']['best_ckpt'] == ckpt_path
-        assert osp.exists(ckpt_path)
-        assert runner.meta['hook_msgs']['best_score'] == 7
-    # total_epochs = 8, return the best acc and corresponding epoch
-    loader = DataLoader(EvalDataset())
-    model = Model()
-    data_loader = DataLoader(EvalDataset())
-    eval_hook = EvalHook(data_loader, interval=1, save_best='acc')
-    with tempfile.TemporaryDirectory() as tmpdir:
-        logger = get_logger('test_eval')
-        runner = EpochBasedRunner(model=model, work_dir=tmpdir, logger=logger)
-        runner.register_checkpoint_hook(dict(interval=1))
-        runner.register_hook(eval_hook)
-        runner.run([loader], [('train', 1)], 8)
-        ckpt_path = osp.join(tmpdir, 'best_acc_epoch_4.pth')
-        assert runner.meta['hook_msgs']['best_ckpt'] == ckpt_path
-        assert osp.exists(ckpt_path)
-        assert runner.meta['hook_msgs']['best_score'] == 7
-    # total_epochs = 8, return the best loss_top and corresponding epoch
-    loader = DataLoader(EvalDataset())
-    model = Model()
-    data_loader = DataLoader(EvalDataset())
-    eval_hook = EvalHook(data_loader, interval=1, save_best='loss_top')
-    with tempfile.TemporaryDirectory() as tmpdir:
-        logger = get_logger('test_eval')
-        runner = EpochBasedRunner(model=model, work_dir=tmpdir, logger=logger)
-        runner.register_checkpoint_hook(dict(interval=1))
-        runner.register_hook(eval_hook)
-        runner.run([loader], [('train', 1)], 8)
-        ckpt_path = osp.join(tmpdir, 'best_loss_top_epoch_6.pth')
-        assert runner.meta['hook_msgs']['best_ckpt'] == ckpt_path
-        assert osp.exists(ckpt_path)
-        assert runner.meta['hook_msgs']['best_score'] == -3
-    # total_epochs = 8, return the best score and corresponding epoch
-    data_loader = DataLoader(EvalDataset())
-    eval_hook = EvalHook(
-        data_loader, interval=1, save_best='score', rule='greater')
-    with tempfile.TemporaryDirectory() as tmpdir:
-        logger = get_logger('test_eval')
-        runner = EpochBasedRunner(model=model, work_dir=tmpdir, logger=logger)
-        runner.register_checkpoint_hook(dict(interval=1))
-        runner.register_hook(eval_hook)
-        runner.run([loader], [('train', 1)], 8)
-        ckpt_path = osp.join(tmpdir, 'best_score_epoch_4.pth')
-        assert runner.meta['hook_msgs']['best_ckpt'] == ckpt_path
-        assert osp.exists(ckpt_path)
-        assert runner.meta['hook_msgs']['best_score'] == 7
-    # total_epochs = 8, return the best score using less compare func
-    # and indicate corresponding epoch
-    data_loader = DataLoader(EvalDataset())
-    eval_hook = EvalHook(data_loader, save_best='acc', rule='less')
-    with tempfile.TemporaryDirectory() as tmpdir:
-        logger = get_logger('test_eval')
-        runner = EpochBasedRunner(model=model, work_dir=tmpdir, logger=logger)
-        runner.register_checkpoint_hook(dict(interval=1))
-        runner.register_hook(eval_hook)
-        runner.run([loader], [('train', 1)], 8)
-        ckpt_path = osp.join(tmpdir, 'best_acc_epoch_6.pth')
-        assert runner.meta['hook_msgs']['best_ckpt'] == ckpt_path
-        assert osp.exists(ckpt_path)
-        assert runner.meta['hook_msgs']['best_score'] == -3
-    # Test the EvalHook when resume happened
-    data_loader = DataLoader(EvalDataset())
-    eval_hook = EvalHook(data_loader, save_best='acc')
-    with tempfile.TemporaryDirectory() as tmpdir:
-        logger = get_logger('test_eval')
-        runner = EpochBasedRunner(model=model, work_dir=tmpdir, logger=logger)
-        runner.register_checkpoint_hook(dict(interval=1))
-        runner.register_hook(eval_hook)
-        runner.run([loader], [('train', 1)], 2)
-        old_ckpt_path = osp.join(tmpdir, 'best_acc_epoch_2.pth')
-        assert runner.meta['hook_msgs']['best_ckpt'] == old_ckpt_path
-        assert osp.exists(old_ckpt_path)
-        assert runner.meta['hook_msgs']['best_score'] == 4
-        resume_from = old_ckpt_path
-        loader = DataLoader(ExampleDataset())
-        eval_hook = EvalHook(data_loader, save_best='acc')
-        runner = EpochBasedRunner(model=model, work_dir=tmpdir, logger=logger)
-        runner.register_checkpoint_hook(dict(interval=1))
-        runner.register_hook(eval_hook)
-        runner.resume(resume_from)
-        assert runner.meta['hook_msgs']['best_ckpt'] == old_ckpt_path
-        assert osp.exists(old_ckpt_path)
-        assert runner.meta['hook_msgs']['best_score'] == 4
-        runner.run([loader], [('train', 1)], 8)
-        ckpt_path = osp.join(tmpdir, 'best_acc_epoch_4.pth')
-        assert runner.meta['hook_msgs']['best_ckpt'] == ckpt_path
-        assert osp.exists(ckpt_path)
-        assert runner.meta['hook_msgs']['best_score'] == 7
-        assert not osp.exists(old_ckpt_path)
-    # test EvalHook with customer test_fn and greater/less keys
-    loader = DataLoader(EvalDataset())
-    model = Model()
-    data_loader = DataLoader(EvalDataset())
-    eval_hook = EvalHook(
-        data_loader,
-        save_best='acc',
-        test_fn=mock.MagicMock(return_value={}),
-        greater_keys=[],
-        less_keys=['acc'])
-    with tempfile.TemporaryDirectory() as tmpdir:
-        logger = get_logger('test_eval')
-        runner = EpochBasedRunner(model=model, work_dir=tmpdir, logger=logger)
-        runner.register_checkpoint_hook(dict(interval=1))
-        runner.register_hook(eval_hook)
-        runner.run([loader], [('train', 1)], 8)
-        ckpt_path = osp.join(tmpdir, 'best_acc_epoch_6.pth')
-        assert runner.meta['hook_msgs']['best_ckpt'] == ckpt_path
-        assert osp.exists(ckpt_path)
-        assert runner.meta['hook_msgs']['best_score'] == -3
-    # test EvalHook with specified `out_dir`
-    loader = DataLoader(EvalDataset())
-    model = Model()
-    data_loader = DataLoader(EvalDataset())
-    out_dir = 's3://user/data'
-    eval_hook = EvalHook(
-        data_loader, interval=1, save_best='auto', out_dir=out_dir)
-    with patch.object(PetrelBackend, 'put') as mock_put, \
-         patch.object(PetrelBackend, 'remove') as mock_remove, \
-         patch.object(PetrelBackend, 'isfile') as mock_isfile, \
-         tempfile.TemporaryDirectory() as tmpdir:
-        logger = get_logger('test_eval')
-        runner = EpochBasedRunner(model=model, work_dir=tmpdir, logger=logger)
-        runner.register_checkpoint_hook(dict(interval=1))
-        runner.register_hook(eval_hook)
-        runner.run([loader], [('train', 1)], 8)
-        basename = osp.basename(runner.work_dir.rstrip(osp.sep))
-        ckpt_path = f'{out_dir}/{basename}/best_acc_epoch_4.pth'
-        assert runner.meta['hook_msgs']['best_ckpt'] == ckpt_path
-        assert runner.meta['hook_msgs']['best_score'] == 7
-    assert mock_put.call_count == 3
-    assert mock_remove.call_count == 2
-    assert mock_isfile.call_count == 2
-@patch('mmcv.engine.single_gpu_test', MagicMock)
-@patch('mmcv.engine.multi_gpu_test', MagicMock)
-@pytest.mark.parametrize('EvalHookParam', [EvalHook, DistEvalHook])
-@pytest.mark.parametrize('_build_demo_runner,by_epoch',
-                         [(_build_epoch_runner, True),
-                          (_build_iter_runner, False)])
-def test_start_param(EvalHookParam, _build_demo_runner, by_epoch):
-    # create dummy data
-    dataloader = DataLoader(EvalDataset())
-    # 0.1. dataloader is not a DataLoader object
-    with pytest.raises(TypeError):
-        EvalHookParam(dataloader=MagicMock(), interval=-1)
-    # 0.2. negative interval
-    with pytest.raises(ValueError):
-        EvalHookParam(dataloader, interval=-1)
-    # 0.3. negative start
-    with pytest.raises(ValueError):
-        EvalHookParam(dataloader, start=-1)
-    # 1. start=None, interval=1: perform evaluation after each epoch.
-    runner = _build_demo_runner()
-    evalhook = EvalHookParam(dataloader, interval=1, by_epoch=by_epoch)
-    evalhook.evaluate = MagicMock()
-    runner.register_hook(evalhook)
-    runner.run([dataloader], [('train', 1)], 2)
-    assert evalhook.evaluate.call_count == 2  # after epoch 1 & 2
-    # 2. start=1, interval=1: perform evaluation after each epoch.
-    runner = _build_demo_runner()
-    evalhook = EvalHookParam(
-        dataloader, start=1, interval=1, by_epoch=by_epoch)
-    evalhook.evaluate = MagicMock()
-    runner.register_hook(evalhook)
-    runner.run([dataloader], [('train', 1)], 2)
-    assert evalhook.evaluate.call_count == 2  # after epoch 1 & 2
-    # 3. start=None, interval=2: perform evaluation after epoch 2, 4, 6, etc
-    runner = _build_demo_runner()
-    evalhook = EvalHookParam(dataloader, interval=2, by_epoch=by_epoch)
-    evalhook.evaluate = MagicMock()
-    runner.register_hook(evalhook)
-    runner.run([dataloader], [('train', 1)], 2)
-    assert evalhook.evaluate.call_count == 1  # after epoch 2
-    # 4. start=1, interval=2: perform evaluation after epoch 1, 3, 5, etc
-    runner = _build_demo_runner()
-    evalhook = EvalHookParam(
-        dataloader, start=1, interval=2, by_epoch=by_epoch)
-    evalhook.evaluate = MagicMock()
-    runner.register_hook(evalhook)
-    runner.run([dataloader], [('train', 1)], 3)
-    assert evalhook.evaluate.call_count == 2  # after epoch 1 & 3
-    # 5. start=0, interval=1: perform evaluation after each epoch and
-    #    before epoch 1.
-    runner = _build_demo_runner()
-    evalhook = EvalHookParam(dataloader, start=0, by_epoch=by_epoch)
-    evalhook.evaluate = MagicMock()
-    runner.register_hook(evalhook)
-    runner.run([dataloader], [('train', 1)], 2)
-    assert evalhook.evaluate.call_count == 3  # before epoch1 and after e1 & e2
-    # 6. resuming from epoch i, start = x (x<=i), interval =1: perform
-    #    evaluation after each epoch and before the first epoch.
-    runner = _build_demo_runner()
-    evalhook = EvalHookParam(dataloader, start=1, by_epoch=by_epoch)
-    evalhook.evaluate = MagicMock()
-    runner.register_hook(evalhook)
-    if by_epoch:
-        runner._epoch = 2
-    else:
-        runner._iter = 2
-    runner.run([dataloader], [('train', 1)], 3)
-    assert evalhook.evaluate.call_count == 2  # before & after epoch 3
-    # 7. resuming from epoch i, start = i+1/None, interval =1: perform
-    #    evaluation after each epoch.
-    runner = _build_demo_runner()
-    evalhook = EvalHookParam(dataloader, start=2, by_epoch=by_epoch)
-    evalhook.evaluate = MagicMock()
-    runner.register_hook(evalhook)
-    if by_epoch:
-        runner._epoch = 1
-    else:
-        runner._iter = 1
-    runner.run([dataloader], [('train', 1)], 3)
-    assert evalhook.evaluate.call_count == 2  # after epoch 2 & 3
-@pytest.mark.parametrize('runner,by_epoch,eval_hook_priority',
-                         [(EpochBasedRunner, True, 'NORMAL'),
-                          (EpochBasedRunner, True, 'LOW'),
-                          (IterBasedRunner, False, 'LOW')])
-def test_logger(runner, by_epoch, eval_hook_priority):
-    loader = DataLoader(EvalDataset())
-    model = Model()
-    data_loader = DataLoader(EvalDataset())
-    eval_hook = EvalHook(
-        data_loader, interval=1, by_epoch=by_epoch, save_best='acc')
-    with tempfile.TemporaryDirectory() as tmpdir:
-        logger = get_logger('test_logger')
-        optimizer = optim.SGD(model.parameters(), lr=0.001, momentum=0.9)
-        runner = EpochBasedRunner(
-            model=model, optimizer=optimizer, work_dir=tmpdir, logger=logger)
-        runner.register_logger_hooks(
-            dict(
-                interval=1,
-                hooks=[dict(type='TextLoggerHook', by_epoch=by_epoch)]))
-        runner.register_timer_hook(dict(type='IterTimerHook'))
-        runner.register_hook(eval_hook, priority=eval_hook_priority)
-        runner.run([loader], [('train', 1)], 1)
-        path = osp.join(tmpdir, next(scandir(tmpdir, '.json')))
-        with open(path) as fr:
-            fr.readline()  # skip the first line which is `hook_msg`
-            train_log = json.loads(fr.readline())
-            assert train_log['mode'] == 'train' and 'time' in train_log
-            val_log = json.loads(fr.readline())
-            assert val_log['mode'] == 'val' and 'time' not in val_log
--- a/tests/test_runner/test_fp16.py
+++ b/tests/test_runner/test_fp16.py
-# Copyright (c) OpenMMLab. All rights reserved.
-import numpy as np
-import pytest
-import torch
-import torch.nn as nn
-from mmcv.runner.fp16_utils import auto_fp16, cast_tensor_type, force_fp32
-def test_cast_tensor_type():
-    inputs = torch.FloatTensor([5.])
-    src_type = torch.float32
-    dst_type = torch.int32
-    outputs = cast_tensor_type(inputs, src_type, dst_type)
-    assert isinstance(outputs, torch.Tensor)
-    assert outputs.dtype == dst_type
-    # convert torch.float to torch.half
-    inputs = torch.FloatTensor([5.])
-    src_type = torch.float
-    dst_type = torch.half
-    outputs = cast_tensor_type(inputs, src_type, dst_type)
-    assert isinstance(outputs, torch.Tensor)
-    assert outputs.dtype == dst_type
-    # skip the conversion when the type of input is not the same as src_type
-    inputs = torch.IntTensor([5])
-    src_type = torch.float
-    dst_type = torch.half
-    outputs = cast_tensor_type(inputs, src_type, dst_type)
-    assert isinstance(outputs, torch.Tensor)
-    assert outputs.dtype == inputs.dtype
-    inputs = 'tensor'
-    src_type = str
-    dst_type = str
-    outputs = cast_tensor_type(inputs, src_type, dst_type)
-    assert isinstance(outputs, str)
-    inputs = np.array([5.])
-    src_type = np.ndarray
-    dst_type = np.ndarray
-    outputs = cast_tensor_type(inputs, src_type, dst_type)
-    assert isinstance(outputs, np.ndarray)
-    inputs = dict(
-        tensor_a=torch.FloatTensor([1.]), tensor_b=torch.FloatTensor([2.]))
-    src_type = torch.float32
-    dst_type = torch.int32
-    outputs = cast_tensor_type(inputs, src_type, dst_type)
-    assert isinstance(outputs, dict)
-    assert outputs['tensor_a'].dtype == dst_type
-    assert outputs['tensor_b'].dtype == dst_type
-    inputs = [torch.FloatTensor([1.]), torch.FloatTensor([2.])]
-    src_type = torch.float32
-    dst_type = torch.int32
-    outputs = cast_tensor_type(inputs, src_type, dst_type)
-    assert isinstance(outputs, list)
-    assert outputs[0].dtype == dst_type
-    assert outputs[1].dtype == dst_type
-    inputs = 5
-    outputs = cast_tensor_type(inputs, None, None)
-    assert isinstance(outputs, int)
-def test_auto_fp16():
-    with pytest.raises(TypeError):
-        # ExampleObject is not a subclass of nn.Module
-        class ExampleObject:
-            @auto_fp16()
-            def __call__(self, x):
-                return x
-        model = ExampleObject()
-        input_x = torch.ones(1, dtype=torch.float32)
-        model(input_x)
-    # apply to all input args
-    class ExampleModule(nn.Module):
-        @auto_fp16()
-        def forward(self, x, y):
-            return x, y
-    model = ExampleModule()
-    input_x = torch.ones(1, dtype=torch.float32)
-    input_y = torch.ones(1, dtype=torch.float32)
-    output_x, output_y = model(input_x, input_y)
-    assert output_x.dtype == torch.float32
-    assert output_y.dtype == torch.float32
-    model.fp16_enabled = True
-    output_x, output_y = model(input_x, input_y)
-    assert output_x.dtype == torch.half
-    assert output_y.dtype == torch.half
-    if torch.cuda.is_available():
-        model.cuda()
-        output_x, output_y = model(input_x.cuda(), input_y.cuda())
-        assert output_x.dtype == torch.half
-        assert output_y.dtype == torch.half
-    # apply to specified input args
-    class ExampleModule(nn.Module):
-        @auto_fp16(apply_to=('x', ))
-        def forward(self, x, y):
-            return x, y
-    model = ExampleModule()
-    input_x = torch.ones(1, dtype=torch.float32)
-    input_y = torch.ones(1, dtype=torch.float32)
-    output_x, output_y = model(input_x, input_y)
-    assert output_x.dtype == torch.float32
-    assert output_y.dtype == torch.float32
-    model.fp16_enabled = True
-    output_x, output_y = model(input_x, input_y)
-    assert output_x.dtype == torch.half
-    assert output_y.dtype == torch.float32
-    if torch.cuda.is_available():
-        model.cuda()
-        output_x, output_y = model(input_x.cuda(), input_y.cuda())
-        assert output_x.dtype == torch.half
-        assert output_y.dtype == torch.float32
-    # apply to optional input args
-    class ExampleModule(nn.Module):
-        @auto_fp16(apply_to=('x', 'y'))
-        def forward(self, x, y=None, z=None):
-            return x, y, z
-    model = ExampleModule()
-    input_x = torch.ones(1, dtype=torch.float32)
-    input_y = torch.ones(1, dtype=torch.float32)
-    input_z = torch.ones(1, dtype=torch.float32)
-    output_x, output_y, output_z = model(input_x, y=input_y, z=input_z)
-    assert output_x.dtype == torch.float32
-    assert output_y.dtype == torch.float32
-    assert output_z.dtype == torch.float32
-    model.fp16_enabled = True
-    output_x, output_y, output_z = model(input_x, y=input_y, z=input_z)
-    assert output_x.dtype == torch.half
-    assert output_y.dtype == torch.half
-    assert output_z.dtype == torch.float32
-    if torch.cuda.is_available():
-        model.cuda()
-        output_x, output_y, output_z = model(
-            input_x.cuda(), y=input_y.cuda(), z=input_z.cuda())
-        assert output_x.dtype == torch.half
-        assert output_y.dtype == torch.half
-        assert output_z.dtype == torch.float32
-    # out_fp32=True
-    class ExampleModule(nn.Module):
-        @auto_fp16(apply_to=('x', 'y'), out_fp32=True)
-        def forward(self, x, y=None, z=None):
-            return x, y, z
-    model = ExampleModule()
-    input_x = torch.ones(1, dtype=torch.half)
-    input_y = torch.ones(1, dtype=torch.float32)
-    input_z = torch.ones(1, dtype=torch.float32)
-    output_x, output_y, output_z = model(input_x, y=input_y, z=input_z)
-    assert output_x.dtype == torch.half
-    assert output_y.dtype == torch.float32
-    assert output_z.dtype == torch.float32
-    model.fp16_enabled = True
-    output_x, output_y, output_z = model(input_x, y=input_y, z=input_z)
-    assert output_x.dtype == torch.float32
-    assert output_y.dtype == torch.float32
-    assert output_z.dtype == torch.float32
-    if torch.cuda.is_available():
-        model.cuda()
-        output_x, output_y, output_z = model(
-            input_x.cuda(), y=input_y.cuda(), z=input_z.cuda())
-        assert output_x.dtype == torch.float32
-        assert output_y.dtype == torch.float32
-        assert output_z.dtype == torch.float32
-def test_force_fp32():
-    with pytest.raises(TypeError):
-        # ExampleObject is not a subclass of nn.Module
-        class ExampleObject:
-            @force_fp32()
-            def __call__(self, x):
-                return x
-        model = ExampleObject()
-        input_x = torch.ones(1, dtype=torch.float32)
-        model(input_x)
-    # apply to all input args
-    class ExampleModule(nn.Module):
-        @force_fp32()
-        def forward(self, x, y):
-            return x, y
-    model = ExampleModule()
-    input_x = torch.ones(1, dtype=torch.half)
-    input_y = torch.ones(1, dtype=torch.half)
-    output_x, output_y = model(input_x, input_y)
-    assert output_x.dtype == torch.half
-    assert output_y.dtype == torch.half
-    model.fp16_enabled = True
-    output_x, output_y = model(input_x, input_y)
-    assert output_x.dtype == torch.float32
-    assert output_y.dtype == torch.float32
-    if torch.cuda.is_available():
-        model.cuda()
-        output_x, output_y = model(input_x.cuda(), input_y.cuda())
-        assert output_x.dtype == torch.float32
-        assert output_y.dtype == torch.float32
-    # apply to specified input args
-    class ExampleModule(nn.Module):
-        @force_fp32(apply_to=('x', ))
-        def forward(self, x, y):
-            return x, y
-    model = ExampleModule()
-    input_x = torch.ones(1, dtype=torch.half)
-    input_y = torch.ones(1, dtype=torch.half)
-    output_x, output_y = model(input_x, input_y)
-    assert output_x.dtype == torch.half
-    assert output_y.dtype == torch.half
-    model.fp16_enabled = True
-    output_x, output_y = model(input_x, input_y)
-    assert output_x.dtype == torch.float32
-    assert output_y.dtype == torch.half
-    if torch.cuda.is_available():
-        model.cuda()
-        output_x, output_y = model(input_x.cuda(), input_y.cuda())
-        assert output_x.dtype == torch.float32
-        assert output_y.dtype == torch.half
-    # apply to optional input args
-    class ExampleModule(nn.Module):
-        @force_fp32(apply_to=('x', 'y'))
-        def forward(self, x, y=None, z=None):
-            return x, y, z
-    model = ExampleModule()
-    input_x = torch.ones(1, dtype=torch.half)
-    input_y = torch.ones(1, dtype=torch.half)
-    input_z = torch.ones(1, dtype=torch.half)
-    output_x, output_y, output_z = model(input_x, y=input_y, z=input_z)
-    assert output_x.dtype == torch.half
-    assert output_y.dtype == torch.half
-    assert output_z.dtype == torch.half
-    model.fp16_enabled = True
-    output_x, output_y, output_z = model(input_x, y=input_y, z=input_z)
-    assert output_x.dtype == torch.float32
-    assert output_y.dtype == torch.float32
-    assert output_z.dtype == torch.half
-    if torch.cuda.is_available():
-        model.cuda()
-        output_x, output_y, output_z = model(
-            input_x.cuda(), y=input_y.cuda(), z=input_z.cuda())
-        assert output_x.dtype == torch.float32
-        assert output_y.dtype == torch.float32
-        assert output_z.dtype == torch.half
-    # out_fp16=True
-    class ExampleModule(nn.Module):
-        @force_fp32(apply_to=('x', 'y'), out_fp16=True)
-        def forward(self, x, y=None, z=None):
-            return x, y, z
-    model = ExampleModule()
-    input_x = torch.ones(1, dtype=torch.float32)
-    input_y = torch.ones(1, dtype=torch.half)
-    input_z = torch.ones(1, dtype=torch.half)
-    output_x, output_y, output_z = model(input_x, y=input_y, z=input_z)
-    assert output_x.dtype == torch.float32
-    assert output_y.dtype == torch.half
-    assert output_z.dtype == torch.half
-    model.fp16_enabled = True
-    output_x, output_y, output_z = model(input_x, y=input_y, z=input_z)
-    assert output_x.dtype == torch.half
-    assert output_y.dtype == torch.half
-    assert output_z.dtype == torch.half
-    if torch.cuda.is_available():
-        model.cuda()
-        output_x, output_y, output_z = model(
-            input_x.cuda(), y=input_y.cuda(), z=input_z.cuda())
-        assert output_x.dtype == torch.half
-        assert output_y.dtype == torch.half
-        assert output_z.dtype == torch.half
--- a/tests/test_runner/test_hooks.py
+++ b/tests/test_runner/test_hooks.py
-# Copyright (c) OpenMMLab. All rights reserved.
-"""Tests the hooks with runners.
-CommandLine:
-    pytest tests/test_runner/test_hooks.py
-    xdoctest tests/test_hooks.py zero
-"""
-import logging
-import os.path as osp
-import platform
-import random
-import re
-import shutil
-import sys
-import tempfile
-from unittest.mock import MagicMock, Mock, call, patch
-import pytest
-import torch
-import torch.nn as nn
-from mmengine.fileio.file_client import PetrelBackend
-from torch.nn.init import constant_
-from torch.utils.data import DataLoader
-# yapf: disable
-from mmcv.runner import (CheckpointHook, ClearMLLoggerHook, DvcliveLoggerHook,
-                         EMAHook, Fp16OptimizerHook,
-                         GradientCumulativeFp16OptimizerHook,
-                         GradientCumulativeOptimizerHook, IterTimerHook,
-                         MlflowLoggerHook, NeptuneLoggerHook, OptimizerHook,
-                         PaviLoggerHook, SegmindLoggerHook, WandbLoggerHook,
-                         build_runner)
-# yapf: enable
-from mmcv.runner.fp16_utils import auto_fp16
-from mmcv.runner.hooks.hook import HOOKS, Hook
-from mmcv.runner.hooks.lr_updater import (CosineRestartLrUpdaterHook,
-                                          CyclicLrUpdaterHook,
-                                          FlatCosineAnnealingLrUpdaterHook,
-                                          OneCycleLrUpdaterHook,
-                                          StepLrUpdaterHook)
-from mmcv.utils import TORCH_VERSION
-sys.modules['petrel_client'] = MagicMock()
-sys.modules['petrel_client.client'] = MagicMock()
-@pytest.mark.skipif(
-    torch.__version__ == 'parrots', reason='not supported in parrots now')
-def test_optimizerhook():
-    class Model(nn.Module):
-        def __init__(self):
-            super().__init__()
-            self.conv1 = nn.Conv2d(
-                in_channels=1,
-                out_channels=2,
-                kernel_size=3,
-                stride=1,
-                padding=1,
-                dilation=1)
-            self.conv2 = nn.Conv2d(
-                in_channels=2,
-                out_channels=2,
-                kernel_size=3,
-                stride=1,
-                padding=1,
-                dilation=1)
-            self.conv3 = nn.Conv2d(
-                in_channels=1,
-                out_channels=2,
-                kernel_size=3,
-                stride=1,
-                padding=1,
-                dilation=1)
-        def forward(self, x):
-            x1 = self.conv1(x)
-            x2 = self.conv2(x1)
-            return x1, x2
-    model = Model()
-    x = torch.rand(1, 1, 3, 3)
-    dummy_runner = Mock()
-    dummy_runner.optimizer.zero_grad = Mock(return_value=None)
-    dummy_runner.optimizer.step = Mock(return_value=None)
-    dummy_runner.model = model
-    dummy_runner.outputs = dict()
-    dummy_runner.outputs['num_samples'] = 0
-    class DummyLogger():
-        def __init__(self):
-            self.msg = ''
-        def log(self, msg=None, **kwargs):
-            self.msg += msg
-    dummy_runner.logger = DummyLogger()
-    optimizer_hook = OptimizerHook(
-        dict(max_norm=2), detect_anomalous_params=True)
-    dummy_runner.outputs['loss'] = model(x)[0].sum()
-    optimizer_hook.after_train_iter(dummy_runner)
-    # assert the parameters of conv2 and conv3 are not in the
-    # computational graph which is with x1.sum() as root.
-    assert 'conv2.weight' in dummy_runner.logger.msg
-    assert 'conv2.bias' in dummy_runner.logger.msg
-    assert 'conv3.weight' in dummy_runner.logger.msg
-    assert 'conv3.bias' in dummy_runner.logger.msg
-    assert 'conv1.weight' not in dummy_runner.logger.msg
-    assert 'conv1.bias' not in dummy_runner.logger.msg
-    dummy_runner.outputs['loss'] = model(x)[1].sum()
-    dummy_runner.logger.msg = ''
-    optimizer_hook.after_train_iter(dummy_runner)
-    # assert the parameters of conv3 are not in the computational graph
-    assert 'conv3.weight' in dummy_runner.logger.msg
-    assert 'conv3.bias' in dummy_runner.logger.msg
-    assert 'conv2.weight' not in dummy_runner.logger.msg
-    assert 'conv2.bias' not in dummy_runner.logger.msg
-    assert 'conv1.weight' not in dummy_runner.logger.msg
-    assert 'conv1.bias' not in dummy_runner.logger.msg
-def test_checkpoint_hook(tmp_path):
-    """xdoctest -m tests/test_runner/test_hooks.py test_checkpoint_hook."""
-    # test epoch based runner
-    loader = DataLoader(torch.ones((5, 2)))
-    runner = _build_demo_runner('EpochBasedRunner', max_epochs=1)
-    runner.meta = dict()
-    checkpointhook = CheckpointHook(interval=1, by_epoch=True)
-    runner.register_hook(checkpointhook)
-    runner.run([loader], [('train', 1)])
-    assert runner.meta['hook_msgs']['last_ckpt'] == osp.join(
-        runner.work_dir, 'epoch_1.pth')
-    shutil.rmtree(runner.work_dir)
-    # test petrel oss when the type of runner is `EpochBasedRunner`
-    runner = _build_demo_runner('EpochBasedRunner', max_epochs=4)
-    runner.meta = dict()
-    out_dir = 's3://user/data'
-    with patch.object(PetrelBackend, 'put') as mock_put, \
-            patch.object(PetrelBackend, 'remove') as mock_remove, \
-            patch.object(PetrelBackend, 'isfile') as mock_isfile:
-        checkpointhook = CheckpointHook(
-            interval=1, out_dir=out_dir, by_epoch=True, max_keep_ckpts=2)
-        runner.register_hook(checkpointhook)
-        runner.run([loader], [('train', 1)])
-        basename = osp.basename(runner.work_dir.rstrip(osp.sep))
-        assert runner.meta['hook_msgs']['last_ckpt'] == \
-               '/'.join([out_dir, basename, 'epoch_4.pth'])
-    mock_put.assert_called()
-    mock_remove.assert_called()
-    mock_isfile.assert_called()
-    shutil.rmtree(runner.work_dir)
-    # test iter based runner
-    runner = _build_demo_runner(
-        'IterBasedRunner', max_iters=1, max_epochs=None)
-    runner.meta = dict()
-    checkpointhook = CheckpointHook(interval=1, by_epoch=False)
-    runner.register_hook(checkpointhook)
-    runner.run([loader], [('train', 1)])
-    assert runner.meta['hook_msgs']['last_ckpt'] == osp.join(
-        runner.work_dir, 'iter_1.pth')
-    shutil.rmtree(runner.work_dir)
-    # test petrel oss when the type of runner is `IterBasedRunner`
-    runner = _build_demo_runner(
-        'IterBasedRunner', max_iters=4, max_epochs=None)
-    runner.meta = dict()
-    out_dir = 's3://user/data'
-    with patch.object(PetrelBackend, 'put') as mock_put, \
-            patch.object(PetrelBackend, 'remove') as mock_remove, \
-            patch.object(PetrelBackend, 'isfile') as mock_isfile:
-        checkpointhook = CheckpointHook(
-            interval=1, out_dir=out_dir, by_epoch=False, max_keep_ckpts=2)
-        runner.register_hook(checkpointhook)
-        runner.run([loader], [('train', 1)])
-        basename = osp.basename(runner.work_dir.rstrip(osp.sep))
-        assert runner.meta['hook_msgs']['last_ckpt'] == \
-               '/'.join([out_dir, basename, 'iter_4.pth'])
-    mock_put.assert_called()
-    mock_remove.assert_called()
-    mock_isfile.assert_called()
-    shutil.rmtree(runner.work_dir)
-def test_ema_hook():
-    """xdoctest -m tests/test_hooks.py test_ema_hook."""
-    class DemoModel(nn.Module):
-        def __init__(self):
-            super().__init__()
-            self.conv = nn.Conv2d(
-                in_channels=1,
-                out_channels=2,
-                kernel_size=1,
-                padding=1,
-                bias=True)
-            self._init_weight()
-        def _init_weight(self):
-            constant_(self.conv.weight, 0)
-            constant_(self.conv.bias, 0)
-        def forward(self, x):
-            return self.conv(x).sum()
-        def train_step(self, x, optimizer, **kwargs):
-            return dict(loss=self(x))
-        def val_step(self, x, optimizer, **kwargs):
-            return dict(loss=self(x))
-    loader = DataLoader(torch.ones((1, 1, 1, 1)))
-    runner = _build_demo_runner()
-    demo_model = DemoModel()
-    runner.model = demo_model
-    emahook = EMAHook(momentum=0.1, interval=2, warm_up=100, resume_from=None)
-    checkpointhook = CheckpointHook(interval=1, by_epoch=True)
-    runner.register_hook(emahook, priority='HIGHEST')
-    runner.register_hook(checkpointhook)
-    runner.run([loader, loader], [('train', 1), ('val', 1)])
-    checkpoint = torch.load(f'{runner.work_dir}/epoch_1.pth')
-    contain_ema_buffer = False
-    for name, value in checkpoint['state_dict'].items():
-        if 'ema' in name:
-            contain_ema_buffer = True
-            assert value.sum() == 0
-            value.fill_(1)
-        else:
-            assert value.sum() == 0
-    assert contain_ema_buffer
-    torch.save(checkpoint, f'{runner.work_dir}/epoch_1.pth')
-    work_dir = runner.work_dir
-    resume_ema_hook = EMAHook(
-        momentum=0.5, warm_up=0, resume_from=f'{work_dir}/epoch_1.pth')
-    runner = _build_demo_runner(max_epochs=2)
-    runner.model = demo_model
-    runner.register_hook(resume_ema_hook, priority='HIGHEST')
-    checkpointhook = CheckpointHook(interval=1, by_epoch=True)
-    runner.register_hook(checkpointhook)
-    runner.run([loader, loader], [('train', 1), ('val', 1)])
-    checkpoint = torch.load(f'{runner.work_dir}/epoch_2.pth')
-    contain_ema_buffer = False
-    for name, value in checkpoint['state_dict'].items():
-        if 'ema' in name:
-            contain_ema_buffer = True
-            assert value.sum() == 2
-        else:
-            assert value.sum() == 1
-    assert contain_ema_buffer
-    shutil.rmtree(runner.work_dir)
-    shutil.rmtree(work_dir)
-def test_custom_hook():
-    @HOOKS.register_module()
-    class ToyHook(Hook):
-        def __init__(self, info, *args, **kwargs):
-            super().__init__()
-            self.info = info
-    runner = _build_demo_runner_without_hook('EpochBasedRunner', max_epochs=1)
-    # test if custom_hooks is None
-    runner.register_custom_hooks(None)
-    assert len(runner.hooks) == 0
-    # test if custom_hooks is dict list
-    custom_hooks_cfg = [
-        dict(type='ToyHook', priority=51, info=51),
-        dict(type='ToyHook', priority=49, info=49)
-    ]
-    runner.register_custom_hooks(custom_hooks_cfg)
-    assert [hook.info for hook in runner.hooks] == [49, 51]
-    # test if custom_hooks is object and without priority
-    runner.register_custom_hooks(ToyHook(info='default'))
-    assert len(runner.hooks) == 3 and runner.hooks[1].info == 'default'
-    shutil.rmtree(runner.work_dir)
-    runner = _build_demo_runner_without_hook('EpochBasedRunner', max_epochs=1)
-    # test custom_hooks with string priority setting
-    priority_ranks = [
-        'HIGHEST', 'VERY_HIGH', 'HIGH', 'ABOVE_NORMAL', 'NORMAL',
-        'BELOW_NORMAL', 'LOW', 'VERY_LOW', 'LOWEST'
-    ]
-    random_priority_ranks = priority_ranks.copy()
-    random.shuffle(random_priority_ranks)
-    custom_hooks_cfg = [
-        dict(type='ToyHook', priority=rank, info=rank)
-        for rank in random_priority_ranks
-    ]
-    runner.register_custom_hooks(custom_hooks_cfg)
-    assert [hook.info for hook in runner.hooks] == priority_ranks
-    shutil.rmtree(runner.work_dir)
-    runner = _build_demo_runner_without_hook('EpochBasedRunner', max_epochs=1)
-    # test register_training_hooks order
-    custom_hooks_cfg = [
-        dict(type='ToyHook', priority=1, info='custom 1'),
-        dict(type='ToyHook', priority='NORMAL', info='custom normal'),
-        dict(type='ToyHook', priority=89, info='custom 89')
-    ]
-    runner.register_training_hooks(
-        lr_config=ToyHook('lr'),
-        optimizer_config=ToyHook('optimizer'),
-        checkpoint_config=ToyHook('checkpoint'),
-        log_config=dict(interval=1, hooks=[dict(type='ToyHook', info='log')]),
-        momentum_config=ToyHook('momentum'),
-        timer_config=ToyHook('timer'),
-        custom_hooks_config=custom_hooks_cfg)
-    # If custom hooks have same priority with default hooks, custom hooks
-    # will be triggered after default hooks.
-    hooks_order = [
-        'custom 1', 'lr', 'momentum', 'optimizer', 'checkpoint',
-        'custom normal', 'timer', 'custom 89', 'log'
-    ]
-    assert [hook.info for hook in runner.hooks] == hooks_order
-    shutil.rmtree(runner.work_dir)
-def test_pavi_hook():
-    sys.modules['pavi'] = MagicMock()
-    loader = DataLoader(torch.ones((5, 2)))
-    runner = _build_demo_runner()
-    runner.meta = dict(config_dict=dict(lr=0.02, gpu_ids=range(1)))
-    hook = PaviLoggerHook(add_graph=False, add_last_ckpt=True)
-    runner.register_hook(hook)
-    runner.run([loader, loader], [('train', 1), ('val', 1)])
-    shutil.rmtree(runner.work_dir)
-    assert hasattr(hook, 'writer')
-    hook.writer.add_scalars.assert_called_with('val', {
-        'learning_rate': 0.02,
-        'momentum': 0.95
-    }, 1)
-    # in Windows environment, the latest checkpoint is copied from epoch_1.pth
-    if platform.system() == 'Windows':
-        snapshot_file_path = osp.join(runner.work_dir, 'latest.pth')
-    else:
-        snapshot_file_path = osp.join(runner.work_dir, 'epoch_1.pth')
-    hook.writer.add_snapshot_file.assert_called_with(
-        tag=runner.work_dir.split('/')[-1],
-        snapshot_file_path=snapshot_file_path,
-        iteration=1)
-def test_sync_buffers_hook():
-    loader = DataLoader(torch.ones((5, 2)))
-    runner = _build_demo_runner()
-    runner.register_hook_from_cfg(dict(type='SyncBuffersHook'))
-    runner.run([loader, loader], [('train', 1), ('val', 1)])
-    shutil.rmtree(runner.work_dir)
-@pytest.mark.parametrize('multi_optimizers, max_iters, gamma, cyclic_times',
-                         [(True, 8, 1, 1), (False, 8, 0.5, 2)])
-def test_momentum_runner_hook(multi_optimizers, max_iters, gamma,
-                              cyclic_times):
-    """xdoctest -m tests/test_hooks.py test_momentum_runner_hook."""
-    sys.modules['pavi'] = MagicMock()
-    loader = DataLoader(torch.ones((10, 2)))
-    runner = _build_demo_runner(multi_optimizers=multi_optimizers)
-    # add momentum scheduler
-    hook_cfg = dict(
-        type='CyclicMomentumUpdaterHook',
-        by_epoch=False,
-        target_ratio=(0.85 / 0.95, 1),
-        cyclic_times=cyclic_times,
-        step_ratio_up=0.4,
-        gamma=gamma)
-    runner.register_hook_from_cfg(hook_cfg)
-    # add momentum LR scheduler
-    hook_cfg = dict(
-        type='CyclicLrUpdaterHook',
-        by_epoch=False,
-        target_ratio=(10, 1),
-        cyclic_times=1,
-        step_ratio_up=0.4)
-    runner.register_hook_from_cfg(hook_cfg)
-    runner.register_hook_from_cfg(dict(type='IterTimerHook'))
-    # add pavi hook
-    hook = PaviLoggerHook(interval=1, add_graph=False, add_last_ckpt=True)
-    runner.register_hook(hook)
-    runner.run([loader], [('train', 1)])
-    shutil.rmtree(runner.work_dir)
-    # TODO: use a more elegant way to check values
-    assert hasattr(hook, 'writer')
-    if multi_optimizers:
-        calls = [
-            call(
-                'train', {
-                    'learning_rate/model1': 0.01999999999999999,
-                    'learning_rate/model2': 0.009999999999999995,
-                    'momentum/model1': 0.95,
-                    'momentum/model2': 0.9,
-                }, 1),
-            call(
-                'train', {
-                    'learning_rate/model1': 0.2,
-                    'learning_rate/model2': 0.1,
-                    'momentum/model1': 0.85,
-                    'momentum/model2': 0.8052631578947369,
-                }, 5),
-            call(
-                'train', {
-                    'learning_rate/model1': 0.155,
-                    'learning_rate/model2': 0.0775,
-                    'momentum/model1': 0.875,
-                    'momentum/model2': 0.8289473684210527,
-                }, 7)
-        ]
-    else:
-        calls = [
-            call('train', {
-                'learning_rate': 0.01999999999999999,
-                'momentum': 0.95
-            }, 1),
-            call('train', {
-                'learning_rate': 0.11,
-                'momentum': 0.85
-            }, 3),
-            call('train', {
-                'learning_rate': 0.1879422863405995,
-                'momentum': 0.95
-            }, 6),
-            call('train', {
-                'learning_rate': 0.11000000000000001,
-                'momentum': 0.9
-            }, 8),
-        ]
-    hook.writer.add_scalars.assert_has_calls(calls, any_order=True)
-    # test constant momentum warmup
-    sys.modules['pavi'] = MagicMock()
-    runner = _build_demo_runner(multi_optimizers=multi_optimizers)
-    # add momentum scheduler
-    hook_cfg = dict(
-        type='StepMomentumUpdaterHook',
-        by_epoch=False,
-        warmup='constant',
-        warmup_iters=5,
-        warmup_ratio=0.5,
-        step=[10],
-    )
-    runner.register_hook_from_cfg(hook_cfg)
-    runner.register_hook_from_cfg(dict(type='IterTimerHook'))
-    hook = PaviLoggerHook(interval=1, add_graph=False, add_last_ckpt=True)
-    runner.register_hook(hook)
-    runner.run([loader], [('train', 1)])
-    shutil.rmtree(runner.work_dir)
-    assert hasattr(hook, 'writer')
-    if multi_optimizers:
-        calls = [
-            call(
-                'train', {
-                    'learning_rate/model1': 0.02,
-                    'learning_rate/model2': 0.01,
-                    'momentum/model1': 1.9,
-                    'momentum/model2': 1.8,
-                }, 1),
-            call(
-                'train', {
-                    'learning_rate/model1': 0.02,
-                    'learning_rate/model2': 0.01,
-                    'momentum/model1': 1.9,
-                    'momentum/model2': 1.8,
-                }, 5),
-            call(
-                'train', {
-                    'learning_rate/model1': 0.02,
-                    'learning_rate/model2': 0.01,
-                    'momentum/model1': 0.95,
-                    'momentum/model2': 0.9,
-                }, 10),
-        ]
-    else:
-        calls = [
-            call('train', {
-                'learning_rate': 0.02,
-                'momentum': 1.9
-            }, 1),
-            call('train', {
-                'learning_rate': 0.02,
-                'momentum': 1.9
-            }, 5),
-            call('train', {
-                'learning_rate': 0.02,
-                'momentum': 0.95
-            }, 10),
-        ]
-    hook.writer.add_scalars.assert_has_calls(calls, any_order=True)
-    # test linear momentum warmup
-    sys.modules['pavi'] = MagicMock()
-    runner = _build_demo_runner(multi_optimizers=multi_optimizers)
-    # add momentum scheduler
-    hook_cfg = dict(
-        type='StepMomentumUpdaterHook',
-        by_epoch=False,
-        warmup='linear',
-        warmup_iters=5,
-        warmup_ratio=0.5,
-        step=[10],
-    )
-    runner.register_hook_from_cfg(hook_cfg)
-    runner.register_hook_from_cfg(dict(type='IterTimerHook'))
-    hook = PaviLoggerHook(interval=1, add_graph=False, add_last_ckpt=True)
-    runner.register_hook(hook)
-    runner.run([loader], [('train', 1)])
-    shutil.rmtree(runner.work_dir)
-    assert hasattr(hook, 'writer')
-    if multi_optimizers:
-        calls = [
-            call(
-                'train', {
-                    'learning_rate/model1': 0.02,
-                    'learning_rate/model2': 0.01,
-                    'momentum/model1': 1.9,
-                    'momentum/model2': 1.8,
-                }, 1),
-            call(
-                'train', {
-                    'learning_rate/model1': 0.02,
-                    'learning_rate/model2': 0.01,
-                    'momentum/model1': 1.3571428571428572,
-                    'momentum/model2': 1.2857142857142858,
-                }, 3),
-            call(
-                'train', {
-                    'learning_rate/model1': 0.02,
-                    'learning_rate/model2': 0.01,
-                    'momentum/model1': 0.95,
-                    'momentum/model2': 0.9,
-                }, 10),
-        ]
-    else:
-        calls = [
-            call('train', {
-                'learning_rate': 0.02,
-                'momentum': 1.9
-            }, 1),
-            call('train', {
-                'learning_rate': 0.02,
-                'momentum': 1.3571428571428572
-            }, 3),
-            call('train', {
-                'learning_rate': 0.02,
-                'momentum': 0.95
-            }, 10),
-        ]
-    hook.writer.add_scalars.assert_has_calls(calls, any_order=True)
-    # test exponentially momentum warmup
-    sys.modules['pavi'] = MagicMock()
-    runner = _build_demo_runner(multi_optimizers=multi_optimizers)
-    # add momentum scheduler
-    hook_cfg = dict(
-        type='StepMomentumUpdaterHook',
-        by_epoch=False,
-        warmup='exp',
-        warmup_iters=5,
-        warmup_ratio=0.5,
-        step=[10],
-    )
-    runner.register_hook_from_cfg(hook_cfg)
-    runner.register_hook_from_cfg(dict(type='IterTimerHook'))
-    hook = PaviLoggerHook(interval=1, add_graph=False, add_last_ckpt=True)
-    runner.register_hook(hook)
-    runner.run([loader], [('train', 1)])
-    shutil.rmtree(runner.work_dir)
-    assert hasattr(hook, 'writer')
-    if multi_optimizers:
-        calls = [
-            call(
-                'train', {
-                    'learning_rate/model1': 0.02,
-                    'learning_rate/model2': 0.01,
-                    'momentum/model1': 1.9,
-                    'momentum/model2': 1.8,
-                }, 1),
-            call(
-                'train', {
-                    'learning_rate/model1': 0.02,
-                    'learning_rate/model2': 0.01,
-                    'momentum/model1': 1.4399307381848783,
-                    'momentum/model2': 1.3641449098593583,
-                }, 3),
-            call(
-                'train', {
-                    'learning_rate/model1': 0.02,
-                    'learning_rate/model2': 0.01,
-                    'momentum/model1': 0.95,
-                    'momentum/model2': 0.9,
-                }, 10),
-        ]
-    else:
-        calls = [
-            call('train', {
-                'learning_rate': 0.02,
-                'momentum': 1.9
-            }, 1),
-            call('train', {
-                'learning_rate': 0.02,
-                'momentum': 1.4399307381848783
-            }, 3),
-            call('train', {
-                'learning_rate': 0.02,
-                'momentum': 0.95
-            }, 10),
-        ]
-    hook.writer.add_scalars.assert_has_calls(calls, any_order=True)
-@pytest.mark.parametrize('multi_optimizers', (True, False))
-def test_cosine_runner_hook(multi_optimizers):
-    """xdoctest -m tests/test_hooks.py test_cosine_runner_hook."""
-    sys.modules['pavi'] = MagicMock()
-    loader = DataLoader(torch.ones((10, 2)))
-    runner = _build_demo_runner(multi_optimizers=multi_optimizers)
-    # add momentum scheduler
-    hook_cfg = dict(
-        type='CosineAnnealingMomentumUpdaterHook',
-        min_momentum_ratio=0.99 / 0.95,
-        by_epoch=False,
-        warmup_iters=2,
-        warmup_ratio=0.9 / 0.95)
-    runner.register_hook_from_cfg(hook_cfg)
-    # add momentum LR scheduler
-    hook_cfg = dict(
-        type='CosineAnnealingLrUpdaterHook',
-        by_epoch=False,
-        min_lr_ratio=0,
-        warmup_iters=2,
-        warmup_ratio=0.9)
-    runner.register_hook_from_cfg(hook_cfg)
-    runner.register_hook_from_cfg(dict(type='IterTimerHook'))
-    runner.register_hook(IterTimerHook())
-    # add pavi hook
-    hook = PaviLoggerHook(interval=1, add_graph=False, add_last_ckpt=True)
-    runner.register_hook(hook)
-    runner.run([loader], [('train', 1)])
-    shutil.rmtree(runner.work_dir)
-    # TODO: use a more elegant way to check values
-    assert hasattr(hook, 'writer')
-    if multi_optimizers:
-        calls = [
-            call(
-                'train', {
-                    'learning_rate/model1': 0.02,
-                    'learning_rate/model2': 0.01,
-                    'momentum/model1': 0.95,
-                    'momentum/model2': 0.9,
-                }, 1),
-            call(
-                'train', {
-                    'learning_rate/model1': 0.01,
-                    'learning_rate/model2': 0.005,
-                    'momentum/model1': 0.97,
-                    'momentum/model2': 0.9189473684210527,
-                }, 6),
-            call(
-                'train', {
-                    'learning_rate/model1': 0.0004894348370484647,
-                    'learning_rate/model2': 0.00024471741852423234,
-                    'momentum/model1': 0.9890211303259032,
-                    'momentum/model2': 0.9369673866245399,
-                }, 10)
-        ]
-    else:
-        calls = [
-            call('train', {
-                'learning_rate': 0.02,
-                'momentum': 0.95
-            }, 1),
-            call('train', {
-                'learning_rate': 0.01,
-                'momentum': 0.97
-            }, 6),
-            call(
-                'train', {
-                    'learning_rate': 0.0004894348370484647,
-                    'momentum': 0.9890211303259032
-                }, 10)
-        ]
-    hook.writer.add_scalars.assert_has_calls(calls, any_order=True)
-@pytest.mark.parametrize('multi_optimizers', (True, False))
-def test_linear_runner_hook(multi_optimizers):
-    sys.modules['pavi'] = MagicMock()
-    loader = DataLoader(torch.ones((10, 2)))
-    runner = _build_demo_runner(multi_optimizers=multi_optimizers)
-    # add momentum scheduler
-    hook_cfg = dict(
-        type='LinearAnnealingMomentumUpdaterHook',
-        min_momentum_ratio=0.99 / 0.95,
-        by_epoch=False,
-        warmup_iters=2,
-        warmup_ratio=0.9 / 0.95)
-    runner.register_hook_from_cfg(hook_cfg)
-    # add momentum LR scheduler
-    hook_cfg = dict(
-        type='LinearAnnealingLrUpdaterHook',
-        by_epoch=False,
-        min_lr_ratio=0,
-        warmup_iters=2,
-        warmup_ratio=0.9)
-    runner.register_hook_from_cfg(hook_cfg)
-    runner.register_hook_from_cfg(dict(type='IterTimerHook'))
-    runner.register_hook(IterTimerHook())
-    # add pavi hook
-    hook = PaviLoggerHook(interval=1, add_graph=False, add_last_ckpt=True)
-    runner.register_hook(hook)
-    runner.run([loader], [('train', 1)])
-    shutil.rmtree(runner.work_dir)
-    # TODO: use a more elegant way to check values
-    assert hasattr(hook, 'writer')
-    if multi_optimizers:
-        calls = [
-            call(
-                'train', {
-                    'learning_rate/model1': 0.02,
-                    'learning_rate/model2': 0.01,
-                    'momentum/model1': 0.95,
-                    'momentum/model2': 0.9,
-                }, 1),
-            call(
-                'train', {
-                    'learning_rate/model1': 0.01,
-                    'learning_rate/model2': 0.005,
-                    'momentum/model1': 0.97,
-                    'momentum/model2': 0.9189473684210527,
-                }, 6),
-            call(
-                'train', {
-                    'learning_rate/model1': 0.0019999999999999983,
-                    'learning_rate/model2': 0.0009999999999999992,
-                    'momentum/model1': 0.9860000000000001,
-                    'momentum/model2': 0.9341052631578949,
-                }, 10)
-        ]
-    else:
-        calls = [
-            call('train', {
-                'learning_rate': 0.02,
-                'momentum': 0.95
-            }, 1),
-            call('train', {
-                'learning_rate': 0.01,
-                'momentum': 0.97
-            }, 6),
-            call(
-                'train', {
-                    'learning_rate': 0.0019999999999999983,
-                    'momentum': 0.9860000000000001
-                }, 10)
-        ]
-    hook.writer.add_scalars.assert_has_calls(calls, any_order=True)
-@pytest.mark.parametrize('multi_optimizers, by_epoch', [(False, False),
-                                                        (True, False),
-                                                        (False, True),
-                                                        (True, True)])
-def test_flat_cosine_runner_hook(multi_optimizers, by_epoch):
-    """xdoctest -m tests/test_hooks.py test_flat_cosine_runner_hook."""
-    sys.modules['pavi'] = MagicMock()
-    loader = DataLoader(torch.ones((10, 2)))
-    max_epochs = 10 if by_epoch else 1
-    runner = _build_demo_runner(
-        multi_optimizers=multi_optimizers, max_epochs=max_epochs)
-    with pytest.raises(ValueError):
-        # start_percent: expected float between 0 and 1
-        FlatCosineAnnealingLrUpdaterHook(start_percent=-0.1, min_lr_ratio=0)
-    # add LR scheduler
-    hook_cfg = dict(
-        type='FlatCosineAnnealingLrUpdaterHook',
-        by_epoch=by_epoch,
-        min_lr_ratio=0,
-        warmup='linear',
-        warmup_iters=10 if by_epoch else 2,
-        warmup_ratio=0.9,
-        start_percent=0.5)
-    runner.register_hook_from_cfg(hook_cfg)
-    runner.register_hook_from_cfg(dict(type='IterTimerHook'))
-    runner.register_hook(IterTimerHook())
-    # add pavi hook
-    hook = PaviLoggerHook(interval=1, add_graph=False, add_last_ckpt=True)
-    runner.register_hook(hook)
-    runner.run([loader], [('train', 1)])
-    shutil.rmtree(runner.work_dir)
-    # TODO: use a more elegant way to check values
-    assert hasattr(hook, 'writer')
-    if multi_optimizers:
-        if by_epoch:
-            calls = [
-                call(
-                    'train', {
-                        'learning_rate/model1': 0.018000000000000002,
-                        'learning_rate/model2': 0.009000000000000001,
-                        'momentum/model1': 0.95,
-                        'momentum/model2': 0.9,
-                    }, 1),
-                call(
-                    'train', {
-                        'learning_rate/model1': 0.02,
-                        'learning_rate/model2': 0.01,
-                        'momentum/model1': 0.95,
-                        'momentum/model2': 0.9,
-                    }, 11),
-                call(
-                    'train', {
-                        'learning_rate/model1': 0.018090169943749474,
-                        'learning_rate/model2': 0.009045084971874737,
-                        'momentum/model1': 0.95,
-                        'momentum/model2': 0.9,
-                    }, 61),
-                call(
-                    'train', {
-                        'learning_rate/model1': 0.0019098300562505265,
-                        'learning_rate/model2': 0.0009549150281252633,
-                        'momentum/model1': 0.95,
-                        'momentum/model2': 0.9,
-                    }, 100)
-            ]
-        else:
-            calls = [
-                call(
-                    'train', {
-                        'learning_rate/model1': 0.018000000000000002,
-                        'learning_rate/model2': 0.009000000000000001,
-                        'momentum/model1': 0.95,
-                        'momentum/model2': 0.9
-                    }, 1),
-                call(
-                    'train', {
-                        'learning_rate/model1': 0.02,
-                        'learning_rate/model2': 0.01,
-                        'momentum/model1': 0.95,
-                        'momentum/model2': 0.9
-                    }, 6),
-                call(
-                    'train', {
-                        'learning_rate/model1': 0.018090169943749474,
-                        'learning_rate/model2': 0.009045084971874737,
-                        'momentum/model1': 0.95,
-                        'momentum/model2': 0.9
-                    }, 7),
-                call(
-                    'train', {
-                        'learning_rate/model1': 0.0019098300562505265,
-                        'learning_rate/model2': 0.0009549150281252633,
-                        'momentum/model1': 0.95,
-                        'momentum/model2': 0.9
-                    }, 10)
-            ]
-    else:
-        if by_epoch:
-            calls = [
-                call('train', {
-                    'learning_rate': 0.018000000000000002,
-                    'momentum': 0.95
-                }, 1),
-                call('train', {
-                    'learning_rate': 0.02,
-                    'momentum': 0.95
-                }, 11),
-                call('train', {
-                    'learning_rate': 0.018090169943749474,
-                    'momentum': 0.95
-                }, 61),
-                call('train', {
-                    'learning_rate': 0.0019098300562505265,
-                    'momentum': 0.95
-                }, 100)
-            ]
-        else:
-            calls = [
-                call('train', {
-                    'learning_rate': 0.018000000000000002,
-                    'momentum': 0.95
-                }, 1),
-                call('train', {
-                    'learning_rate': 0.02,
-                    'momentum': 0.95
-                }, 6),
-                call('train', {
-                    'learning_rate': 0.018090169943749474,
-                    'momentum': 0.95
-                }, 7),
-                call('train', {
-                    'learning_rate': 0.0019098300562505265,
-                    'momentum': 0.95
-                }, 10)
-            ]
-    hook.writer.add_scalars.assert_has_calls(calls, any_order=True)
-@pytest.mark.skipif(
-    torch.__version__ == 'parrots', reason='not supported in parrots now')
-@pytest.mark.parametrize('multi_optimizers, max_iters', [(True, 10), (True, 2),
-                                                         (False, 10),
-                                                         (False, 2)])
-def test_one_cycle_runner_hook(multi_optimizers, max_iters):
-    """Test OneCycleLrUpdaterHook and OneCycleMomentumUpdaterHook."""
-    with pytest.raises(AssertionError):
-        # by_epoch should be False
-        OneCycleLrUpdaterHook(max_lr=0.1, by_epoch=True)
-    with pytest.raises(ValueError):
-        # expected float between 0 and 1
-        OneCycleLrUpdaterHook(max_lr=0.1, pct_start=-0.1)
-    with pytest.raises(ValueError):
-        # anneal_strategy should be either 'cos' or 'linear'
-        OneCycleLrUpdaterHook(max_lr=0.1, anneal_strategy='sin')
-    sys.modules['pavi'] = MagicMock()
-    loader = DataLoader(torch.ones((10, 2)))
-    runner = _build_demo_runner(multi_optimizers=multi_optimizers)
-    # add momentum scheduler
-    hook_cfg = dict(
-        type='OneCycleMomentumUpdaterHook',
-        base_momentum=0.85,
-        max_momentum=0.95,
-        pct_start=0.5,
-        anneal_strategy='cos',
-        three_phase=False)
-    runner.register_hook_from_cfg(hook_cfg)
-    # add LR scheduler
-    hook_cfg = dict(
-        type='OneCycleLrUpdaterHook',
-        max_lr=0.01,
-        pct_start=0.5,
-        anneal_strategy='cos',
-        div_factor=25,
-        final_div_factor=1e4,
-        three_phase=False)
-    runner.register_hook_from_cfg(hook_cfg)
-    runner.register_hook_from_cfg(dict(type='IterTimerHook'))
-    runner.register_hook(IterTimerHook())
-    # add pavi hook
-    hook = PaviLoggerHook(interval=1, add_graph=False, add_last_ckpt=True)
-    runner.register_hook(hook)
-    runner.run([loader], [('train', 1)])
-    shutil.rmtree(runner.work_dir)
-    # TODO: use a more elegant way to check values
-    assert hasattr(hook, 'writer')
-    if multi_optimizers:
-        calls = [
-            call(
-                'train', {
-                    'learning_rate/model1': 0.0003999999999999993,
-                    'learning_rate/model2': 0.0003999999999999993,
-                    'momentum/model1': 0.95,
-                    'momentum/model2': 0.95,
-                }, 1),
-            call(
-                'train', {
-                    'learning_rate/model1': 0.00904508879153485,
-                    'learning_rate/model2': 0.00904508879153485,
-                    'momentum/model1': 0.8595491502812526,
-                    'momentum/model2': 0.8595491502812526,
-                }, 6),
-            call(
-                'train', {
-                    'learning_rate/model1': 4e-08,
-                    'learning_rate/model2': 4e-08,
-                    'momentum/model1': 0.95,
-                    'momentum/model2': 0.95,
-                }, 10)
-        ]
-    else:
-        calls = [
-            call('train', {
-                'learning_rate': 0.0003999999999999993,
-                'momentum': 0.95
-            }, 1),
-            call(
-                'train', {
-                    'learning_rate': 0.00904508879153485,
-                    'momentum': 0.8595491502812526
-                }, 6),
-            call('train', {
-                'learning_rate': 4e-08,
-                'momentum': 0.95
-            }, 10)
-        ]
-    hook.writer.add_scalars.assert_has_calls(calls, any_order=True)
-    # Test OneCycleLrUpdaterHook
-    sys.modules['pavi'] = MagicMock()
-    loader = DataLoader(torch.ones((10, 2)))
-    runner = _build_demo_runner(
-        runner_type='IterBasedRunner', max_epochs=None, max_iters=max_iters)
-    args = dict(
-        max_lr=0.01,
-        total_steps=5,
-        pct_start=0.5,
-        anneal_strategy='linear',
-        div_factor=25,
-        final_div_factor=1e4,
-    )
-    hook = OneCycleLrUpdaterHook(**args)
-    runner.register_hook(hook)
-    if max_iters == 10:
-        # test total_steps < max_iters
-        with pytest.raises(ValueError):
-            runner.run([loader], [('train', 1)])
-    else:
-        # test total_steps > max_iters
-        runner.run([loader], [('train', 1)])
-        lr_last = runner.current_lr()
-        t = torch.tensor([0.0], requires_grad=True)
-        optim = torch.optim.SGD([t], lr=0.01)
-        lr_scheduler = torch.optim.lr_scheduler.OneCycleLR(optim, **args)
-        lr_target = []
-        for _ in range(max_iters):
-            optim.step()
-            lr_target.append(optim.param_groups[0]['lr'])
-            lr_scheduler.step()
-        assert lr_target[-1] == lr_last[0]
-@pytest.mark.parametrize('multi_optimizers', (True, False))
-def test_cosine_restart_lr_update_hook(multi_optimizers):
-    """Test CosineRestartLrUpdaterHook."""
-    with pytest.raises(AssertionError):
-        # either `min_lr` or `min_lr_ratio` should be specified
-        CosineRestartLrUpdaterHook(
-            by_epoch=False,
-            periods=[2, 10],
-            restart_weights=[0.5, 0.5],
-            min_lr=0.1,
-            min_lr_ratio=0)
-    with pytest.raises(AssertionError):
-        # periods and restart_weights should have the same length
-        CosineRestartLrUpdaterHook(
-            by_epoch=False,
-            periods=[2, 10],
-            restart_weights=[0.5],
-            min_lr_ratio=0)
-    with pytest.raises(ValueError):
-        # the last cumulative_periods 7 (out of [5, 7]) should >= 10
-        sys.modules['pavi'] = MagicMock()
-        loader = DataLoader(torch.ones((10, 2)))
-        runner = _build_demo_runner()
-        # add cosine restart LR scheduler
-        hook = CosineRestartLrUpdaterHook(
-            by_epoch=False,
-            periods=[5, 2],  # cumulative_periods [5, 7 (5 + 2)]
-            restart_weights=[0.5, 0.5],
-            min_lr=0.0001)
-        runner.register_hook(hook)
-        runner.register_hook(IterTimerHook())
-        # add pavi hook
-        hook = PaviLoggerHook(interval=1, add_graph=False, add_last_ckpt=True)
-        runner.register_hook(hook)
-        runner.run([loader], [('train', 1)])
-        shutil.rmtree(runner.work_dir)
-    sys.modules['pavi'] = MagicMock()
-    loader = DataLoader(torch.ones((10, 2)))
-    runner = _build_demo_runner(multi_optimizers=multi_optimizers)
-    # add cosine restart LR scheduler
-    hook = CosineRestartLrUpdaterHook(
-        by_epoch=False,
-        periods=[5, 5],
-        restart_weights=[0.5, 0.5],
-        min_lr_ratio=0)
-    runner.register_hook(hook)
-    runner.register_hook(IterTimerHook())
-    # add pavi hook
-    hook = PaviLoggerHook(interval=1, add_graph=False, add_last_ckpt=True)
-    runner.register_hook(hook)
-    runner.run([loader], [('train', 1)])
-    shutil.rmtree(runner.work_dir)
-    # TODO: use a more elegant way to check values
-    assert hasattr(hook, 'writer')
-    if multi_optimizers:
-        calls = [
-            call(
-                'train', {
-                    'learning_rate/model1': 0.01,
-                    'learning_rate/model2': 0.005,
-                    'momentum/model1': 0.95,
-                    'momentum/model2': 0.9,
-                }, 1),
-            call(
-                'train', {
-                    'learning_rate/model1': 0.01,
-                    'learning_rate/model2': 0.005,
-                    'momentum/model1': 0.95,
-                    'momentum/model2': 0.9,
-                }, 6),
-            call(
-                'train', {
-                    'learning_rate/model1': 0.0009549150281252633,
-                    'learning_rate/model2': 0.00047745751406263163,
-                    'momentum/model1': 0.95,
-                    'momentum/model2': 0.9,
-                }, 10)
-        ]
-    else:
-        calls = [
-            call('train', {
-                'learning_rate': 0.01,
-                'momentum': 0.95
-            }, 1),
-            call('train', {
-                'learning_rate': 0.01,
-                'momentum': 0.95
-            }, 6),
-            call('train', {
-                'learning_rate': 0.0009549150281252633,
-                'momentum': 0.95
-            }, 10)
-        ]
-    hook.writer.add_scalars.assert_has_calls(calls, any_order=True)
-@pytest.mark.parametrize('multi_optimizers', (True, False))
-def test_step_runner_hook(multi_optimizers):
-    """Test StepLrUpdaterHook."""
-    with pytest.raises(TypeError):
-        # `step` should be specified
-        StepLrUpdaterHook()
-    with pytest.raises(AssertionError):
-        # if `step` is int, should be positive
-        StepLrUpdaterHook(-10)
-    with pytest.raises(AssertionError):
-        # if `step` is list of int, should all be positive
-        StepLrUpdaterHook([10, 16, -20])
-    # test StepLrUpdaterHook with int `step` value
-    sys.modules['pavi'] = MagicMock()
-    loader = DataLoader(torch.ones((30, 2)))
-    runner = _build_demo_runner(multi_optimizers=multi_optimizers)
-    # add momentum scheduler
-    hook_cfg = dict(
-        type='StepMomentumUpdaterHook',
-        by_epoch=False,
-        step=5,
-        gamma=0.5,
-        min_momentum=0.05)
-    runner.register_hook_from_cfg(hook_cfg)
-    # add step LR scheduler
-    hook = StepLrUpdaterHook(by_epoch=False, step=5, gamma=0.5, min_lr=1e-3)
-    runner.register_hook(hook)
-    runner.register_hook(IterTimerHook())
-    # add pavi hook
-    hook = PaviLoggerHook(interval=1, add_graph=False, add_last_ckpt=True)
-    runner.register_hook(hook)
-    runner.run([loader], [('train', 1)])
-    shutil.rmtree(runner.work_dir)
-    # TODO: use a more elegant way to check values
-    assert hasattr(hook, 'writer')
-    if multi_optimizers:
-        calls = [
-            call(
-                'train', {
-                    'learning_rate/model1': 0.02,
-                    'learning_rate/model2': 0.01,
-                    'momentum/model1': 0.95,
-                    'momentum/model2': 0.9
-                }, 1),
-            call(
-                'train', {
-                    'learning_rate/model1': 0.01,
-                    'learning_rate/model2': 0.005,
-                    'momentum/model1': 0.475,
-                    'momentum/model2': 0.45
-                }, 6),
-            call(
-                'train', {
-                    'learning_rate/model1': 0.0025,
-                    'learning_rate/model2': 0.00125,
-                    'momentum/model1': 0.11875,
-                    'momentum/model2': 0.1125
-                }, 16),
-            call(
-                'train', {
-                    'learning_rate/model1': 0.00125,
-                    'learning_rate/model2': 0.001,
-                    'momentum/model1': 0.059375,
-                    'momentum/model2': 0.05625
-                }, 21),
-            call(
-                'train', {
-                    'learning_rate/model1': 0.001,
-                    'learning_rate/model2': 0.001,
-                    'momentum/model1': 0.05,
-                    'momentum/model2': 0.05
-                }, 26),
-            call(
-                'train', {
-                    'learning_rate/model1': 0.001,
-                    'learning_rate/model2': 0.001,
-                    'momentum/model1': 0.05,
-                    'momentum/model2': 0.05
-                }, 30)
-        ]
-    else:
-        calls = [
-            call('train', {
-                'learning_rate': 0.02,
-                'momentum': 0.95
-            }, 1),
-            call('train', {
-                'learning_rate': 0.01,
-                'momentum': 0.475
-            }, 6),
-            call('train', {
-                'learning_rate': 0.0025,
-                'momentum': 0.11875
-            }, 16),
-            call('train', {
-                'learning_rate': 0.00125,
-                'momentum': 0.059375
-            }, 21),
-            call('train', {
-                'learning_rate': 0.001,
-                'momentum': 0.05
-            }, 26),
-            call('train', {
-                'learning_rate': 0.001,
-                'momentum': 0.05
-            }, 30)
-        ]
-    hook.writer.add_scalars.assert_has_calls(calls, any_order=True)
-    # test StepLrUpdaterHook with list[int] `step` value
-    sys.modules['pavi'] = MagicMock()
-    loader = DataLoader(torch.ones((10, 2)))
-    runner = _build_demo_runner(multi_optimizers=multi_optimizers)
-    # add momentum scheduler
-    hook_cfg = dict(
-        type='StepMomentumUpdaterHook',
-        by_epoch=False,
-        step=[4, 6, 8],
-        gamma=0.1)
-    runner.register_hook_from_cfg(hook_cfg)
-    # add step LR scheduler
-    hook = StepLrUpdaterHook(by_epoch=False, step=[4, 6, 8], gamma=0.1)
-    runner.register_hook(hook)
-    runner.register_hook(IterTimerHook())
-    # add pavi hook
-    hook = PaviLoggerHook(interval=1, add_graph=False, add_last_ckpt=True)
-    runner.register_hook(hook)
-    runner.run([loader], [('train', 1)])
-    shutil.rmtree(runner.work_dir)
-    # TODO: use a more elegant way to check values
-    assert hasattr(hook, 'writer')
-    if multi_optimizers:
-        calls = [
-            call(
-                'train', {
-                    'learning_rate/model1': 0.02,
-                    'learning_rate/model2': 0.01,
-                    'momentum/model1': 0.95,
-                    'momentum/model2': 0.9
-                }, 1),
-            call(
-                'train', {
-                    'learning_rate/model1': 0.002,
-                    'learning_rate/model2': 0.001,
-                    'momentum/model1': 9.5e-2,
-                    'momentum/model2': 9.000000000000001e-2
-                }, 5),
-            call(
-                'train', {
-                    'learning_rate/model1': 2.0000000000000004e-4,
-                    'learning_rate/model2': 1.0000000000000002e-4,
-                    'momentum/model1': 9.500000000000001e-3,
-                    'momentum/model2': 9.000000000000003e-3
-                }, 7),
-            call(
-                'train', {
-                    'learning_rate/model1': 2.0000000000000005e-05,
-                    'learning_rate/model2': 1.0000000000000003e-05,
-                    'momentum/model1': 9.500000000000002e-4,
-                    'momentum/model2': 9.000000000000002e-4
-                }, 9)
-        ]
-    else:
-        calls = [
-            call('train', {
-                'learning_rate': 0.02,
-                'momentum': 0.95
-            }, 1),
-            call('train', {
-                'learning_rate': 0.002,
-                'momentum': 0.095
-            }, 5),
-            call(
-                'train', {
-                    'learning_rate': 2.0000000000000004e-4,
-                    'momentum': 9.500000000000001e-3
-                }, 7),
-            call(
-                'train', {
-                    'learning_rate': 2.0000000000000005e-05,
-                    'momentum': 9.500000000000002e-4
-                }, 9)
-        ]
-    hook.writer.add_scalars.assert_has_calls(calls, any_order=True)
-@pytest.mark.parametrize('multi_optimizers, max_iters, gamma, cyclic_times',
-                         [(True, 8, 1, 1), (False, 8, 0.5, 2)])
-def test_cyclic_lr_update_hook(multi_optimizers, max_iters, gamma,
-                               cyclic_times):
-    """Test CyclicLrUpdateHook."""
-    with pytest.raises(AssertionError):
-        # by_epoch should be False
-        CyclicLrUpdaterHook(by_epoch=True)
-    with pytest.raises(AssertionError):
-        # target_ratio must be either float or tuple/list of two floats
-        CyclicLrUpdaterHook(by_epoch=False, target_ratio=(10.0, 0.1, 0.2))
-    with pytest.raises(AssertionError):
-        # step_ratio_up must be in range [0,1)
-        CyclicLrUpdaterHook(by_epoch=False, step_ratio_up=1.4)
-    with pytest.raises(ValueError):
-        # anneal_strategy must be one of "cos" or "linear"
-        CyclicLrUpdaterHook(by_epoch=False, anneal_strategy='sin')
-    with pytest.raises(AssertionError):
-        # gamma must be in range (0, 1]
-        CyclicLrUpdaterHook(by_epoch=False, gamma=0)
-    sys.modules['pavi'] = MagicMock()
-    loader = DataLoader(torch.ones((10, 2)))
-    runner = _build_demo_runner(
-        runner_type='IterBasedRunner',
-        max_epochs=None,
-        max_iters=max_iters,
-        multi_optimizers=multi_optimizers)
-    # add cyclic LR scheduler
-    schedule_hook = CyclicLrUpdaterHook(
-        by_epoch=False,
-        target_ratio=(10.0, 1.0),
-        cyclic_times=cyclic_times,
-        step_ratio_up=0.5,
-        anneal_strategy='linear',
-        gamma=gamma)
-    runner.register_hook(schedule_hook)
-    runner.register_hook_from_cfg(dict(type='IterTimerHook'))
-    runner.register_hook(IterTimerHook())
-    # add pavi hook
-    hook = PaviLoggerHook(interval=1, add_graph=False, add_last_ckpt=True)
-    runner.register_hook(hook)
-    runner.run([loader], [('train', 1)])
-    shutil.rmtree(runner.work_dir)
-    assert hasattr(hook, 'writer')
-    if multi_optimizers:
-        calls = [
-            call(
-                'train', {
-                    'learning_rate/model1': 0.02,
-                    'learning_rate/model2': 0.01,
-                    'momentum/model1': 0.95,
-                    'momentum/model2': 0.9,
-                }, 1),
-            call(
-                'train', {
-                    'learning_rate/model1': 0.155,
-                    'learning_rate/model2': 0.0775,
-                    'momentum/model1': 0.95,
-                    'momentum/model2': 0.9,
-                }, 4),
-            call(
-                'train', {
-                    'learning_rate/model1': 0.155,
-                    'learning_rate/model2': 0.0775,
-                    'momentum/model1': 0.95,
-                    'momentum/model2': 0.9,
-                }, 6)
-        ]
-    else:
-        calls = [
-            call('train', {
-                'learning_rate': 0.02,
-                'momentum': 0.95
-            }, 1),
-            call('train', {
-                'learning_rate': 0.11,
-                'momentum': 0.95
-            }, 4),
-            call('train', {
-                'learning_rate': 0.065,
-                'momentum': 0.95
-            }, 6),
-            call('train', {
-                'learning_rate': 0.11,
-                'momentum': 0.95
-            }, 7),
-        ]
-    hook.writer.add_scalars.assert_has_calls(calls, any_order=True)
-@pytest.mark.parametrize('log_model', (True, False))
-def test_mlflow_hook(log_model):
-    sys.modules['mlflow'] = MagicMock()
-    sys.modules['mlflow.pytorch'] = MagicMock()
-    runner = _build_demo_runner()
-    loader = DataLoader(torch.ones((5, 2)))
-    hook = MlflowLoggerHook(exp_name='test', log_model=log_model)
-    runner.register_hook(hook)
-    runner.run([loader, loader], [('train', 1), ('val', 1)])
-    shutil.rmtree(runner.work_dir)
-    hook.mlflow.set_experiment.assert_called_with('test')
-    hook.mlflow.log_metrics.assert_called_with(
-        {
-            'learning_rate': 0.02,
-            'momentum': 0.95
-        }, step=6)
-    if log_model:
-        hook.mlflow_pytorch.log_model.assert_called_with(
-            runner.model,
-            'models',
-            pip_requirements=[f'torch=={TORCH_VERSION}'])
-    else:
-        assert not hook.mlflow_pytorch.log_model.called
-def test_segmind_hook():
-    sys.modules['segmind'] = MagicMock()
-    runner = _build_demo_runner()
-    hook = SegmindLoggerHook()
-    loader = DataLoader(torch.ones((5, 2)))
-    runner.register_hook(hook)
-    runner.run([loader, loader], [('train', 1), ('val', 1)])
-    shutil.rmtree(runner.work_dir)
-    hook.mlflow_log.assert_called_with(
-        hook.log_metrics, {
-            'learning_rate': 0.02,
-            'momentum': 0.95
-        },
-        step=runner.epoch,
-        epoch=runner.epoch)
-def test_wandb_hook():
-    sys.modules['wandb'] = MagicMock()
-    runner = _build_demo_runner()
-    hook = WandbLoggerHook(log_artifact=True)
-    loader = DataLoader(torch.ones((5, 2)))
-    runner.register_hook(hook)
-    runner.run([loader, loader], [('train', 1), ('val', 1)])
-    shutil.rmtree(runner.work_dir)
-    hook.wandb.init.assert_called_with()
-    hook.wandb.log.assert_called_with({
-        'learning_rate': 0.02,
-        'momentum': 0.95
-    },
-                                      step=6,
-                                      commit=True)
-    hook.wandb.log_artifact.assert_called()
-    hook.wandb.join.assert_called_with()
-def test_neptune_hook():
-    sys.modules['neptune'] = MagicMock()
-    sys.modules['neptune.new'] = MagicMock()
-    runner = _build_demo_runner()
-    hook = NeptuneLoggerHook()
-    loader = DataLoader(torch.ones((5, 2)))
-    runner.register_hook(hook)
-    runner.run([loader, loader], [('train', 1), ('val', 1)])
-    shutil.rmtree(runner.work_dir)
-    hook.neptune.init.assert_called_with()
-    hook.run['momentum'].log.assert_called_with(0.95, step=6)
-    hook.run.stop.assert_called_with()
-def test_dvclive_hook():
-    sys.modules['dvclive'] = MagicMock()
-    runner = _build_demo_runner()
-    hook = DvcliveLoggerHook()
-    dvclive_mock = hook.dvclive
-    loader = DataLoader(torch.ones((5, 2)))
-    runner.register_hook(hook)
-    runner.run([loader, loader], [('train', 1), ('val', 1)])
-    shutil.rmtree(runner.work_dir)
-    dvclive_mock.set_step.assert_called_with(6)
-    dvclive_mock.log.assert_called_with('momentum', 0.95)
-def test_dvclive_hook_model_file(tmp_path):
-    sys.modules['dvclive'] = MagicMock()
-    runner = _build_demo_runner()
-    hook = DvcliveLoggerHook(model_file=osp.join(runner.work_dir, 'model.pth'))
-    runner.register_hook(hook)
-    loader = torch.utils.data.DataLoader(torch.ones((5, 2)))
-    loader = DataLoader(torch.ones((5, 2)))
-    runner.run([loader, loader], [('train', 1), ('val', 1)])
-    assert osp.exists(osp.join(runner.work_dir, 'model.pth'))
-    shutil.rmtree(runner.work_dir)
-def test_clearml_hook():
-    sys.modules['clearml'] = MagicMock()
-    runner = _build_demo_runner()
-    hook = ClearMLLoggerHook(init_kwargs={
-        'project_name': 'proj',
-        'task_name': 'task',
-    })
-    loader = DataLoader(torch.ones((5, 2)))
-    runner.register_hook(hook)
-    runner.run([loader, loader], [('train', 1), ('val', 1)])
-    shutil.rmtree(runner.work_dir)
-    hook.clearml.Task.init.assert_called_with(
-        project_name='proj', task_name='task')
-    hook.task.get_logger.assert_called_with()
-    report_scalar_calls = [
-        call('momentum', 'momentum', 0.95, 6),
-        call('learning_rate', 'learning_rate', 0.02, 6),
-    ]
-    hook.task_logger.report_scalar.assert_has_calls(
-        report_scalar_calls, any_order=True)
-def _build_demo_runner_without_hook(runner_type='EpochBasedRunner',
-                                    max_epochs=1,
-                                    max_iters=None,
-                                    multi_optimizers=False):
-    class Model(nn.Module):
-        def __init__(self):
-            super().__init__()
-            self.linear = nn.Linear(2, 1)
-            self.conv = nn.Conv2d(3, 3, 3)
-        def forward(self, x):
-            return self.linear(x)
-        def train_step(self, x, optimizer, **kwargs):
-            return dict(loss=self(x))
-        def val_step(self, x, optimizer, **kwargs):
-            return dict(loss=self(x))
-    model = Model()
-    if multi_optimizers:
-        optimizer = {
-            'model1':
-            torch.optim.SGD(model.linear.parameters(), lr=0.02, momentum=0.95),
-            'model2':
-            torch.optim.SGD(model.conv.parameters(), lr=0.01, momentum=0.9),
-        }
-    else:
-        optimizer = torch.optim.SGD(model.parameters(), lr=0.02, momentum=0.95)
-    tmp_dir = tempfile.mkdtemp()
-    runner = build_runner(
-        dict(type=runner_type),
-        default_args=dict(
-            model=model,
-            work_dir=tmp_dir,
-            optimizer=optimizer,
-            logger=logging.getLogger(),
-            max_epochs=max_epochs,
-            max_iters=max_iters))
-    return runner
-def _build_demo_runner(runner_type='EpochBasedRunner',
-                       max_epochs=1,
-                       max_iters=None,
-                       multi_optimizers=False):
-    log_config = dict(
-        interval=1, hooks=[
-            dict(type='TextLoggerHook'),
-        ])
-    runner = _build_demo_runner_without_hook(runner_type, max_epochs,
-                                             max_iters, multi_optimizers)
-    runner.register_checkpoint_hook(dict(interval=1))
-    runner.register_logger_hooks(log_config)
-    return runner
-def test_runner_with_revise_keys():
-    import os
-    class Model(nn.Module):
-        def __init__(self):
-            super().__init__()
-            self.conv = nn.Conv2d(3, 3, 1)
-    class PrefixModel(nn.Module):
-        def __init__(self):
-            super().__init__()
-            self.backbone = Model()
-    pmodel = PrefixModel()
-    model = Model()
-    checkpoint_path = os.path.join(tempfile.gettempdir(), 'checkpoint.pth')
-    # add prefix
-    torch.save(model.state_dict(), checkpoint_path)
-    runner = _build_demo_runner(runner_type='EpochBasedRunner')
-    runner.model = pmodel
-    state_dict = runner.load_checkpoint(
-        checkpoint_path, revise_keys=[(r'^', 'backbone.')])
-    for key in pmodel.backbone.state_dict().keys():
-        assert torch.equal(pmodel.backbone.state_dict()[key], state_dict[key])
-    # strip prefix
-    torch.save(pmodel.state_dict(), checkpoint_path)
-    runner.model = model
-    state_dict = runner.load_checkpoint(
-        checkpoint_path, revise_keys=[(r'^backbone\.', '')])
-    for key in state_dict.keys():
-        key_stripped = re.sub(r'^backbone\.', '', key)
-        assert torch.equal(model.state_dict()[key_stripped], state_dict[key])
-    os.remove(checkpoint_path)
-def test_get_triggered_stages():
-    class ToyHook(Hook):
-        # test normal stage
-        def before_run():
-            pass
-        # test the method mapped to multi stages.
-        def after_epoch():
-            pass
-    hook = ToyHook()
-    # stages output have order, so here is list instead of set.
-    expected_stages = ['before_run', 'after_train_epoch', 'after_val_epoch']
-    assert hook.get_triggered_stages() == expected_stages
-def test_gradient_cumulative_optimizer_hook():
-    class ToyModel(nn.Module):
-        def __init__(self, with_norm=False):
-            super().__init__()
-            self.fp16_enabled = False
-            self.fc = nn.Linear(3, 2)
-            nn.init.constant_(self.fc.weight, 1.)
-            nn.init.constant_(self.fc.bias, 1.)
-            self.with_norm = with_norm
-            if with_norm:
-                self.norm = nn.BatchNorm1d(2)
-        def forward(self, x):
-            x = self.fc(x)
-            if self.with_norm:
-                x = self.norm(x)
-            return x
-        def train_step(self, x, optimizer, **kwargs):
-            return dict(loss=self(x).mean(), num_samples=x.shape[0])
-        def val_step(self, x, optimizer, **kwargs):
-            return dict(loss=self(x).mean(), num_samples=x.shape[0])
-    def build_toy_runner(config=dict(type='EpochBasedRunner', max_epochs=3)):
-        model = ToyModel()
-        optimizer = torch.optim.SGD(model.parameters(), lr=0.02)
-        tmp_dir = tempfile.mkdtemp()
-        runner = build_runner(
-            config,
-            default_args=dict(
-                model=model,
-                work_dir=tmp_dir,
-                optimizer=optimizer,
-                logger=logging.getLogger(),
-                meta=dict()))
-        return runner
-    with pytest.raises(AssertionError):
-        # cumulative_iters only accepts int
-        GradientCumulativeOptimizerHook(cumulative_iters='str')
-    with pytest.raises(AssertionError):
-        # cumulative_iters only accepts positive number
-        GradientCumulativeOptimizerHook(cumulative_iters=-1)
-    # test epoch based runner
-    data = torch.rand((6, 3))
-    # optimize with cumulative_iters
-    loader_1 = DataLoader(data, batch_size=1)
-    runner_1 = build_toy_runner()
-    optimizer_hook = GradientCumulativeOptimizerHook(
-        grad_clip=dict(max_norm=0.2), cumulative_iters=3)
-    runner_1.register_hook(optimizer_hook)
-    runner_1.run([loader_1], [('train', 1)])
-    # optimize without cumulative_iters
-    loader_2 = DataLoader(data, batch_size=3)
-    runner_2 = build_toy_runner()
-    optimizer_hook = OptimizerHook(grad_clip=dict(max_norm=0.2))
-    runner_2.register_hook(optimizer_hook)
-    runner_2.run([loader_2], [('train', 1)])
-    # test optimizer works well
-    assert (runner_1.model.fc.weight < 1).all()
-    assert (runner_1.model.fc.bias < 1).all()
-    # test optimizer with cumulative_iters gets the same results
-    assert torch.allclose(runner_1.model.fc.weight, runner_2.model.fc.weight)
-    assert torch.allclose(runner_1.model.fc.bias, runner_2.model.fc.bias)
-    shutil.rmtree(runner_1.work_dir)
-    shutil.rmtree(runner_2.work_dir)
-    # test iter based runner
-    data = torch.rand((8, 3))
-    # optimize with cumulative_iters
-    loader_1 = DataLoader(data, batch_size=1)
-    runner_1 = build_toy_runner(dict(type='IterBasedRunner', max_iters=8))
-    optimizer_hook = GradientCumulativeOptimizerHook(
-        grad_clip=dict(max_norm=0.2), cumulative_iters=3)
-    runner_1.register_hook(optimizer_hook)
-    runner_1.run([loader_1], [('train', 1)])
-    # optimize without cumulative_iters
-    loader_2_divisible = DataLoader(data[:6], batch_size=3)
-    loader_2_remainder = DataLoader(data[6:], batch_size=2)
-    runner_2 = build_toy_runner(dict(type='IterBasedRunner', max_iters=3))
-    optimizer_hook = OptimizerHook(grad_clip=dict(max_norm=0.2))
-    runner_2.register_hook(optimizer_hook)
-    runner_2.run([loader_2_divisible, loader_2_remainder], [('train', 2),
-                                                            ('train', 1)])
-    # test optimizer works well
-    assert (runner_1.model.fc.weight < 1).all()
-    assert (runner_1.model.fc.bias < 1).all()
-    # test optimizer with cumulative_iters gets the same results
-    assert torch.allclose(runner_1.model.fc.weight, runner_2.model.fc.weight)
-    assert torch.allclose(runner_1.model.fc.bias, runner_2.model.fc.bias)
-    shutil.rmtree(runner_1.work_dir)
-    shutil.rmtree(runner_2.work_dir)
-    # test has_batch_norm
-    model = ToyModel(with_norm=True)
-    optimizer_hook = GradientCumulativeOptimizerHook(
-        grad_clip=dict(max_norm=0.2), cumulative_iters=3)
-    assert optimizer_hook.has_batch_norm(model)
-@pytest.mark.skipif(
-    not torch.cuda.is_available(), reason='requires CUDA support')
-def test_gradient_cumulative_fp16_optimizer_hook():
-    class ToyModel(nn.Module):
-        def __init__(self):
-            super().__init__()
-            self.fp16_enabled = False
-            self.fc = nn.Linear(3, 2)
-            nn.init.constant_(self.fc.weight, 1.)
-            nn.init.constant_(self.fc.bias, 1.)
-        @auto_fp16(apply_to=('x', ))
-        def forward(self, x):
-            x = self.fc(x)
-            return x
-        def train_step(self, x, optimizer, **kwargs):
-            return dict(loss=self(x).mean(), num_samples=x.shape[0])
-        def val_step(self, x, optimizer, **kwargs):
-            return dict(loss=self(x).mean(), num_samples=x.shape[0])
-    def build_toy_runner(config=dict(type='EpochBasedRunner', max_epochs=3)):
-        model = ToyModel().cuda()
-        optimizer = torch.optim.SGD(model.parameters(), lr=0.02)
-        tmp_dir = tempfile.mkdtemp()
-        runner = build_runner(
-            config,
-            default_args=dict(
-                model=model,
-                work_dir=tmp_dir,
-                optimizer=optimizer,
-                logger=logging.getLogger(),
-                meta=dict()))
-        return runner
-    # test epoch based runner
-    data = torch.rand((6, 3)).cuda()
-    # optimize with cumulative_iters
-    loader_1 = DataLoader(data, batch_size=1)
-    runner_1 = build_toy_runner()
-    optimizer_hook = GradientCumulativeFp16OptimizerHook(
-        grad_clip=dict(max_norm=0.2), cumulative_iters=3)
-    runner_1.register_hook(optimizer_hook)
-    runner_1.run([loader_1], [('train', 1)])
-    # optimize without cumulative_iters
-    loader_2 = DataLoader(data, batch_size=3)
-    runner_2 = build_toy_runner()
-    optimizer_hook = Fp16OptimizerHook(grad_clip=dict(max_norm=0.2))
-    runner_2.register_hook(optimizer_hook)
-    runner_2.run([loader_2], [('train', 1)])
-    # test optimizer works well
-    assert (runner_1.model.fc.weight < 1).all()
-    assert (runner_1.model.fc.bias < 1).all()
-    # test optimizer with cumulative_iters gets the same results
-    assert torch.allclose(runner_1.model.fc.weight, runner_2.model.fc.weight)
-    assert torch.allclose(runner_1.model.fc.bias, runner_2.model.fc.bias)
-    shutil.rmtree(runner_1.work_dir)
-    shutil.rmtree(runner_2.work_dir)
-    # test iter based runner
-    data = torch.rand((8, 3)).cuda()
-    # optimize with cumulative_iters
-    loader_1 = DataLoader(data, batch_size=1)
-    runner_1 = build_toy_runner(dict(type='IterBasedRunner', max_iters=8))
-    optimizer_hook = GradientCumulativeFp16OptimizerHook(
-        grad_clip=dict(max_norm=0.2), cumulative_iters=3)
-    runner_1.register_hook(optimizer_hook)
-    runner_1.run([loader_1], [('train', 1)])
-    # optimize without cumulative_iters
-    loader_2_divisible = DataLoader(data[:6], batch_size=3)
-    loader_2_remainder = DataLoader(data[6:], batch_size=2)
-    runner_2 = build_toy_runner(dict(type='IterBasedRunner', max_iters=3))
-    optimizer_hook = Fp16OptimizerHook(grad_clip=dict(max_norm=0.2))
-    runner_2.register_hook(optimizer_hook)
-    runner_2.run([loader_2_divisible, loader_2_remainder], [('train', 2),
-                                                            ('train', 1)])
-    # test optimizer works well
-    assert (runner_1.model.fc.weight < 1).all()
-    assert (runner_1.model.fc.bias < 1).all()
-    # test optimizer with cumulative_iters gets the same results
-    assert torch.allclose(runner_1.model.fc.weight, runner_2.model.fc.weight)
-    assert torch.allclose(runner_1.model.fc.bias, runner_2.model.fc.bias)
-    shutil.rmtree(runner_1.work_dir)
-    shutil.rmtree(runner_2.work_dir)
--- a/tests/test_runner/test_optimizer.py
+++ b/tests/test_runner/test_optimizer.py
-# Copyright (c) OpenMMLab. All rights reserved.
-import sys
-import warnings
-from unittest.mock import MagicMock
-import pytest
-import torch
-import torch.nn as nn
-from mmcv.runner import OPTIMIZER_BUILDERS, DefaultOptimizerConstructor
-from mmcv.runner.optimizer import build_optimizer, build_optimizer_constructor
-from mmcv.runner.optimizer.builder import TORCH_OPTIMIZERS
-from mmcv.utils.ext_loader import check_ops_exist
-OPS_AVAILABLE = check_ops_exist()
-if not OPS_AVAILABLE:
-    sys.modules['mmcv.ops'] = MagicMock(
-        DeformConv2d=dict, ModulatedDeformConv2d=dict)
-class SubModel(nn.Module):
-    def __init__(self):
-        super().__init__()
-        self.conv1 = nn.Conv2d(2, 2, kernel_size=1, groups=2)
-        self.gn = nn.GroupNorm(2, 2)
-        self.param1 = nn.Parameter(torch.ones(1))
-    def forward(self, x):
-        return x
-class ExampleModel(nn.Module):
-    def __init__(self):
-        super().__init__()
-        self.param1 = nn.Parameter(torch.ones(1))
-        self.conv1 = nn.Conv2d(3, 4, kernel_size=1, bias=False)
-        self.conv2 = nn.Conv2d(4, 2, kernel_size=1)
-        self.bn = nn.BatchNorm2d(2)
-        self.sub = SubModel()
-        if OPS_AVAILABLE:
-            from mmcv.ops import DeformConv2dPack
-            self.dcn = DeformConv2dPack(
-                3, 4, kernel_size=3, deformable_groups=1)
-    def forward(self, x):
-        return x
-class ExampleDuplicateModel(nn.Module):
-    def __init__(self):
-        super().__init__()
-        self.param1 = nn.Parameter(torch.ones(1))
-        self.conv1 = nn.Sequential(nn.Conv2d(3, 4, kernel_size=1, bias=False))
-        self.conv2 = nn.Sequential(nn.Conv2d(4, 2, kernel_size=1))
-        self.bn = nn.BatchNorm2d(2)
-        self.sub = SubModel()
-        self.conv3 = nn.Sequential(nn.Conv2d(3, 4, kernel_size=1, bias=False))
-        self.conv3[0] = self.conv1[0]
-        if OPS_AVAILABLE:
-            from mmcv.ops import DeformConv2dPack
-            self.dcn = DeformConv2dPack(
-                3, 4, kernel_size=3, deformable_groups=1)
-    def forward(self, x):
-        return x
-class PseudoDataParallel(nn.Module):
-    def __init__(self):
-        super().__init__()
-        self.module = ExampleModel()
-    def forward(self, x):
-        return x
-base_lr = 0.01
-base_wd = 0.0001
-momentum = 0.9
-def check_default_optimizer(optimizer, model, prefix=''):
-    assert isinstance(optimizer, torch.optim.SGD)
-    assert optimizer.defaults['lr'] == base_lr
-    assert optimizer.defaults['momentum'] == momentum
-    assert optimizer.defaults['weight_decay'] == base_wd
-    param_groups = optimizer.param_groups[0]
-    if OPS_AVAILABLE:
-        param_names = [
-            'param1', 'conv1.weight', 'conv2.weight', 'conv2.bias',
-            'bn.weight', 'bn.bias', 'sub.param1', 'sub.conv1.weight',
-            'sub.conv1.bias', 'sub.gn.weight', 'sub.gn.bias', 'dcn.weight',
-            'dcn.conv_offset.weight', 'dcn.conv_offset.bias'
-        ]
-    else:
-        param_names = [
-            'param1', 'conv1.weight', 'conv2.weight', 'conv2.bias',
-            'bn.weight', 'bn.bias', 'sub.param1', 'sub.conv1.weight',
-            'sub.conv1.bias', 'sub.gn.weight', 'sub.gn.bias'
-        ]
-    param_dict = dict(model.named_parameters())
-    assert len(param_groups['params']) == len(param_names)
-    for i in range(len(param_groups['params'])):
-        assert torch.equal(param_groups['params'][i],
-                           param_dict[prefix + param_names[i]])
-def check_sgd_optimizer(optimizer,
-                        model,
-                        prefix='',
-                        bias_lr_mult=1,
-                        bias_decay_mult=1,
-                        norm_decay_mult=1,
-                        dwconv_decay_mult=1,
-                        dcn_offset_lr_mult=1,
-                        bypass_duplicate=False):
-    param_groups = optimizer.param_groups
-    assert isinstance(optimizer, torch.optim.SGD)
-    assert optimizer.defaults['lr'] == base_lr
-    assert optimizer.defaults['momentum'] == momentum
-    assert optimizer.defaults['weight_decay'] == base_wd
-    model_parameters = list(model.parameters())
-    assert len(param_groups) == len(model_parameters)
-    for i, param in enumerate(model_parameters):
-        param_group = param_groups[i]
-        assert torch.equal(param_group['params'][0], param)
-        assert param_group['momentum'] == momentum
-    # param1
-    param1 = param_groups[0]
-    assert param1['lr'] == base_lr
-    assert param1['weight_decay'] == base_wd
-    # conv1.weight
-    conv1_weight = param_groups[1]
-    assert conv1_weight['lr'] == base_lr
-    assert conv1_weight['weight_decay'] == base_wd
-    # conv2.weight
-    conv2_weight = param_groups[2]
-    assert conv2_weight['lr'] == base_lr
-    assert conv2_weight['weight_decay'] == base_wd
-    # conv2.bias
-    conv2_bias = param_groups[3]
-    assert conv2_bias['lr'] == base_lr * bias_lr_mult
-    assert conv2_bias['weight_decay'] == base_wd * bias_decay_mult
-    # bn.weight
-    bn_weight = param_groups[4]
-    assert bn_weight['lr'] == base_lr
-    assert bn_weight['weight_decay'] == base_wd * norm_decay_mult
-    # bn.bias
-    bn_bias = param_groups[5]
-    assert bn_bias['lr'] == base_lr
-    assert bn_bias['weight_decay'] == base_wd * norm_decay_mult
-    # sub.param1
-    sub_param1 = param_groups[6]
-    assert sub_param1['lr'] == base_lr
-    assert sub_param1['weight_decay'] == base_wd
-    # sub.conv1.weight
-    sub_conv1_weight = param_groups[7]
-    assert sub_conv1_weight['lr'] == base_lr
-    assert sub_conv1_weight['weight_decay'] == base_wd * dwconv_decay_mult
-    # sub.conv1.bias
-    sub_conv1_bias = param_groups[8]
-    assert sub_conv1_bias['lr'] == base_lr * bias_lr_mult
-    assert sub_conv1_bias['weight_decay'] == base_wd * dwconv_decay_mult
-    # sub.gn.weight
-    sub_gn_weight = param_groups[9]
-    assert sub_gn_weight['lr'] == base_lr
-    assert sub_gn_weight['weight_decay'] == base_wd * norm_decay_mult
-    # sub.gn.bias
-    sub_gn_bias = param_groups[10]
-    assert sub_gn_bias['lr'] == base_lr
-    assert sub_gn_bias['weight_decay'] == base_wd * norm_decay_mult
-    if torch.cuda.is_available():
-        dcn_conv_weight = param_groups[11]
-        assert dcn_conv_weight['lr'] == base_lr
-        assert dcn_conv_weight['weight_decay'] == base_wd
-        dcn_offset_weight = param_groups[12]
-        assert dcn_offset_weight['lr'] == base_lr * dcn_offset_lr_mult
-        assert dcn_offset_weight['weight_decay'] == base_wd
-        dcn_offset_bias = param_groups[13]
-        assert dcn_offset_bias['lr'] == base_lr * dcn_offset_lr_mult
-        assert dcn_offset_bias['weight_decay'] == base_wd
-def test_default_optimizer_constructor():
-    model = ExampleModel()
-    with pytest.raises(TypeError):
-        # optimizer_cfg must be a dict
-        optimizer_cfg = []
-        optim_constructor = DefaultOptimizerConstructor(optimizer_cfg)
-        optim_constructor(model)
-    with pytest.raises(TypeError):
-        # paramwise_cfg must be a dict or None
-        optimizer_cfg = dict(lr=0.0001)
-        paramwise_cfg = ['error']
-        optim_constructor = DefaultOptimizerConstructor(
-            optimizer_cfg, paramwise_cfg)
-        optim_constructor(model)
-    with pytest.raises(ValueError):
-        # bias_decay_mult/norm_decay_mult is specified but weight_decay is None
-        optimizer_cfg = dict(lr=0.0001, weight_decay=None)
-        paramwise_cfg = dict(bias_decay_mult=1, norm_decay_mult=1)
-        optim_constructor = DefaultOptimizerConstructor(
-            optimizer_cfg, paramwise_cfg)
-        optim_constructor(model)
-    # basic config with ExampleModel
-    optimizer_cfg = dict(
-        type='SGD', lr=base_lr, weight_decay=base_wd, momentum=momentum)
-    optim_constructor = DefaultOptimizerConstructor(optimizer_cfg)
-    optimizer = optim_constructor(model)
-    check_default_optimizer(optimizer, model)
-    # basic config with pseudo data parallel
-    model = PseudoDataParallel()
-    optimizer_cfg = dict(
-        type='SGD', lr=base_lr, weight_decay=base_wd, momentum=momentum)
-    paramwise_cfg = None
-    optim_constructor = DefaultOptimizerConstructor(optimizer_cfg)
-    optimizer = optim_constructor(model)
-    check_default_optimizer(optimizer, model, prefix='module.')
-    # basic config with DataParallel
-    if torch.cuda.is_available():
-        model = torch.nn.DataParallel(ExampleModel())
-        optimizer_cfg = dict(
-            type='SGD', lr=base_lr, weight_decay=base_wd, momentum=momentum)
-        paramwise_cfg = None
-        optim_constructor = DefaultOptimizerConstructor(optimizer_cfg)
-        optimizer = optim_constructor(model)
-        check_default_optimizer(optimizer, model, prefix='module.')
-    # Empty paramwise_cfg with ExampleModel
-    model = ExampleModel()
-    optimizer_cfg = dict(
-        type='SGD', lr=base_lr, weight_decay=base_wd, momentum=momentum)
-    paramwise_cfg = dict()
-    optim_constructor = DefaultOptimizerConstructor(optimizer_cfg,
-                                                    paramwise_cfg)
-    optimizer = optim_constructor(model)
-    check_default_optimizer(optimizer, model)
-    # Empty paramwise_cfg with ExampleModel and no grad
-    model = ExampleModel()
-    for param in model.parameters():
-        param.requires_grad = False
-    optimizer_cfg = dict(
-        type='SGD', lr=base_lr, weight_decay=base_wd, momentum=momentum)
-    paramwise_cfg = dict()
-    optim_constructor = DefaultOptimizerConstructor(optimizer_cfg)
-    optimizer = optim_constructor(model)
-    check_default_optimizer(optimizer, model)
-    # paramwise_cfg with ExampleModel
-    model = ExampleModel()
-    optimizer_cfg = dict(
-        type='SGD', lr=base_lr, weight_decay=base_wd, momentum=momentum)
-    paramwise_cfg = dict(
-        bias_lr_mult=2,
-        bias_decay_mult=0.5,
-        norm_decay_mult=0,
-        dwconv_decay_mult=0.1,
-        dcn_offset_lr_mult=0.1)
-    optim_constructor = DefaultOptimizerConstructor(optimizer_cfg,
-                                                    paramwise_cfg)
-    optimizer = optim_constructor(model)
-    check_sgd_optimizer(optimizer, model, **paramwise_cfg)
-    # paramwise_cfg with ExampleModel, weight decay is None
-    model = ExampleModel()
-    optimizer_cfg = dict(type='Rprop', lr=base_lr)
-    paramwise_cfg = dict(bias_lr_mult=2)
-    optim_constructor = DefaultOptimizerConstructor(optimizer_cfg,
-                                                    paramwise_cfg)
-    optimizer = optim_constructor(model)
-    param_groups = optimizer.param_groups
-    assert isinstance(optimizer, torch.optim.Rprop)
-    assert optimizer.defaults['lr'] == base_lr
-    model_parameters = list(model.parameters())
-    assert len(param_groups) == len(model_parameters)
-    for i, param in enumerate(model_parameters):
-        param_group = param_groups[i]
-        assert torch.equal(param_group['params'][0], param)
-    # param1
-    assert param_groups[0]['lr'] == base_lr
-    # conv1.weight
-    assert param_groups[1]['lr'] == base_lr
-    # conv2.weight
-    assert param_groups[2]['lr'] == base_lr
-    # conv2.bias
-    assert param_groups[3]['lr'] == base_lr * paramwise_cfg['bias_lr_mult']
-    # bn.weight
-    assert param_groups[4]['lr'] == base_lr
-    # bn.bias
-    assert param_groups[5]['lr'] == base_lr
-    # sub.param1
-    assert param_groups[6]['lr'] == base_lr
-    # sub.conv1.weight
-    assert param_groups[7]['lr'] == base_lr
-    # sub.conv1.bias
-    assert param_groups[8]['lr'] == base_lr * paramwise_cfg['bias_lr_mult']
-    # sub.gn.weight
-    assert param_groups[9]['lr'] == base_lr
-    # sub.gn.bias
-    assert param_groups[10]['lr'] == base_lr
-    if OPS_AVAILABLE:
-        # dcn.weight
-        assert param_groups[11]['lr'] == base_lr
-        # dcn.conv_offset.weight
-        assert param_groups[12]['lr'] == base_lr
-        # dcn.conv_offset.bias
-        assert param_groups[13]['lr'] == base_lr
-    # paramwise_cfg with pseudo data parallel
-    model = PseudoDataParallel()
-    optimizer_cfg = dict(
-        type='SGD', lr=base_lr, weight_decay=base_wd, momentum=momentum)
-    paramwise_cfg = dict(
-        bias_lr_mult=2,
-        bias_decay_mult=0.5,
-        norm_decay_mult=0,
-        dwconv_decay_mult=0.1,
-        dcn_offset_lr_mult=0.1)
-    optim_constructor = DefaultOptimizerConstructor(optimizer_cfg,
-                                                    paramwise_cfg)
-    optimizer = optim_constructor(model)
-    check_sgd_optimizer(optimizer, model, prefix='module.', **paramwise_cfg)
-    # paramwise_cfg with DataParallel
-    if torch.cuda.is_available():
-        model = torch.nn.DataParallel(ExampleModel())
-        optimizer_cfg = dict(
-            type='SGD', lr=base_lr, weight_decay=base_wd, momentum=momentum)
-        paramwise_cfg = dict(
-            bias_lr_mult=2,
-            bias_decay_mult=0.5,
-            norm_decay_mult=0,
-            dwconv_decay_mult=0.1,
-            dcn_offset_lr_mult=0.1)
-        optim_constructor = DefaultOptimizerConstructor(
-            optimizer_cfg, paramwise_cfg)
-        optimizer = optim_constructor(model)
-        check_sgd_optimizer(
-            optimizer, model, prefix='module.', **paramwise_cfg)
-    # paramwise_cfg with ExampleModel and no grad
-    for param in model.parameters():
-        param.requires_grad = False
-    optim_constructor = DefaultOptimizerConstructor(optimizer_cfg,
-                                                    paramwise_cfg)
-    optimizer = optim_constructor(model)
-    param_groups = optimizer.param_groups
-    assert isinstance(optimizer, torch.optim.SGD)
-    assert optimizer.defaults['lr'] == base_lr
-    assert optimizer.defaults['momentum'] == momentum
-    assert optimizer.defaults['weight_decay'] == base_wd
-    for i, (name, param) in enumerate(model.named_parameters()):
-        param_group = param_groups[i]
-        assert torch.equal(param_group['params'][0], param)
-        assert param_group['momentum'] == momentum
-        assert param_group['lr'] == base_lr
-        assert param_group['weight_decay'] == base_wd
-    # paramwise_cfg with bypass_duplicate option
-    model = ExampleDuplicateModel()
-    optimizer_cfg = dict(
-        type='SGD', lr=base_lr, weight_decay=base_wd, momentum=momentum)
-    paramwise_cfg = dict(
-        bias_lr_mult=2,
-        bias_decay_mult=0.5,
-        norm_decay_mult=0,
-        dwconv_decay_mult=0.1)
-    with pytest.raises(ValueError) as excinfo:
-        optim_constructor = DefaultOptimizerConstructor(
-            optimizer_cfg, paramwise_cfg)
-        optim_constructor(model)
-        assert 'some parameters appear in more than one parameter ' \
-               'group' == excinfo.value
-    paramwise_cfg = dict(
-        bias_lr_mult=2,
-        bias_decay_mult=0.5,
-        norm_decay_mult=0,
-        dwconv_decay_mult=0.1,
-        dcn_offset_lr_mult=0.1,
-        bypass_duplicate=True)
-    optim_constructor = DefaultOptimizerConstructor(optimizer_cfg,
-                                                    paramwise_cfg)
-    with warnings.catch_warnings(record=True) as w:
-        optimizer = optim_constructor(model)
-        warnings.simplefilter('always')
-        assert len(w) == 1
-        assert str(w[0].message) == 'conv3.0 is duplicate. It is skipped ' \
-                                    'since bypass_duplicate=True'
-    model_parameters = list(model.parameters())
-    num_params = 14 if OPS_AVAILABLE else 11
-    assert len(optimizer.param_groups) == len(model_parameters) == num_params
-    check_sgd_optimizer(optimizer, model, **paramwise_cfg)
-    # test DefaultOptimizerConstructor with custom_keys and ExampleModel
-    model = ExampleModel()
-    optimizer_cfg = dict(
-        type='SGD', lr=base_lr, weight_decay=base_wd, momentum=momentum)
-    paramwise_cfg = dict(
-        custom_keys={
-            'param1': dict(lr_mult=10),
-            'sub': dict(lr_mult=0.1, decay_mult=0),
-            'sub.gn': dict(lr_mult=0.01),
-            'non_exist_key': dict(lr_mult=0.0)
-        },
-        norm_decay_mult=0.5)
-    with pytest.raises(TypeError):
-        # custom_keys should be a dict
-        paramwise_cfg_ = dict(custom_keys=[0.1, 0.0001])
-        optim_constructor = DefaultOptimizerConstructor(
-            optimizer_cfg, paramwise_cfg_)
-        optimizer = optim_constructor(model)
-    with pytest.raises(ValueError):
-        # if 'decay_mult' is specified in custom_keys, weight_decay should be
-        # specified
-        optimizer_cfg_ = dict(type='SGD', lr=0.01)
-        paramwise_cfg_ = dict(custom_keys={'.backbone': dict(decay_mult=0.5)})
-        optim_constructor = DefaultOptimizerConstructor(
-            optimizer_cfg_, paramwise_cfg_)
-        optimizer = optim_constructor(model)
-    optim_constructor = DefaultOptimizerConstructor(optimizer_cfg,
-                                                    paramwise_cfg)
-    optimizer = optim_constructor(model)
-    # check optimizer type and default config
-    assert isinstance(optimizer, torch.optim.SGD)
-    assert optimizer.defaults['lr'] == base_lr
-    assert optimizer.defaults['momentum'] == momentum
-    assert optimizer.defaults['weight_decay'] == base_wd
-    # check params groups
-    param_groups = optimizer.param_groups
-    groups = []
-    group_settings = []
-    # group 1, matches of 'param1'
-    # 'param1' is the longest match for 'sub.param1'
-    groups.append(['param1', 'sub.param1'])
-    group_settings.append({
-        'lr': base_lr * 10,
-        'momentum': momentum,
-        'weight_decay': base_wd,
-    })
-    # group 2, matches of 'sub.gn'
-    groups.append(['sub.gn.weight', 'sub.gn.bias'])
-    group_settings.append({
-        'lr': base_lr * 0.01,
-        'momentum': momentum,
-        'weight_decay': base_wd,
-    })
-    # group 3, matches of 'sub'
-    groups.append(['sub.conv1.weight', 'sub.conv1.bias'])
-    group_settings.append({
-        'lr': base_lr * 0.1,
-        'momentum': momentum,
-        'weight_decay': 0,
-    })
-    # group 4, bn is configured by 'norm_decay_mult'
-    groups.append(['bn.weight', 'bn.bias'])
-    group_settings.append({
-        'lr': base_lr,
-        'momentum': momentum,
-        'weight_decay': base_wd * 0.5,
-    })
-    # group 5, default group
-    groups.append(['conv1.weight', 'conv2.weight', 'conv2.bias'])
-    group_settings.append({
-        'lr': base_lr,
-        'momentum': momentum,
-        'weight_decay': base_wd
-    })
-    num_params = 14 if OPS_AVAILABLE else 11
-    assert len(param_groups) == num_params
-    for i, (name, param) in enumerate(model.named_parameters()):
-        assert torch.equal(param_groups[i]['params'][0], param)
-        for group, settings in zip(groups, group_settings):
-            if name in group:
-                for setting in settings:
-                    assert param_groups[i][setting] == settings[
-                        setting], f'{name} {setting}'
-    # test DefaultOptimizerConstructor with custom_keys and ExampleModel 2
-    model = ExampleModel()
-    optimizer_cfg = dict(type='SGD', lr=base_lr, momentum=momentum)
-    paramwise_cfg = dict(custom_keys={'param1': dict(lr_mult=10)})
-    optim_constructor = DefaultOptimizerConstructor(optimizer_cfg,
-                                                    paramwise_cfg)
-    optimizer = optim_constructor(model)
-    # check optimizer type and default config
-    assert isinstance(optimizer, torch.optim.SGD)
-    assert optimizer.defaults['lr'] == base_lr
-    assert optimizer.defaults['momentum'] == momentum
-    assert optimizer.defaults['weight_decay'] == 0
-    # check params groups
-    param_groups = optimizer.param_groups
-    groups = []
-    group_settings = []
-    # group 1, matches of 'param1'
-    groups.append(['param1', 'sub.param1'])
-    group_settings.append({
-        'lr': base_lr * 10,
-        'momentum': momentum,
-        'weight_decay': 0,
-    })
-    # group 2, default group
-    groups.append([
-        'sub.conv1.weight', 'sub.conv1.bias', 'sub.gn.weight', 'sub.gn.bias',
-        'conv1.weight', 'conv2.weight', 'conv2.bias', 'bn.weight', 'bn.bias'
-    ])
-    group_settings.append({
-        'lr': base_lr,
-        'momentum': momentum,
-        'weight_decay': 0
-    })
-    num_params = 14 if OPS_AVAILABLE else 11
-    assert len(param_groups) == num_params
-    for i, (name, param) in enumerate(model.named_parameters()):
-        assert torch.equal(param_groups[i]['params'][0], param)
-        for group, settings in zip(groups, group_settings):
-            if name in group:
-                for setting in settings:
-                    assert param_groups[i][setting] == settings[
-                        setting], f'{name} {setting}'
-def test_torch_optimizers():
-    torch_optimizers = [
-        'ASGD', 'Adadelta', 'Adagrad', 'Adam', 'AdamW', 'Adamax', 'LBFGS',
-        'Optimizer', 'RMSprop', 'Rprop', 'SGD', 'SparseAdam'
-    ]
-    assert set(torch_optimizers).issubset(set(TORCH_OPTIMIZERS))
-def test_build_optimizer_constructor():
-    model = ExampleModel()
-    optimizer_cfg = dict(
-        type='SGD', lr=base_lr, weight_decay=base_wd, momentum=momentum)
-    paramwise_cfg = dict(
-        bias_lr_mult=2,
-        bias_decay_mult=0.5,
-        norm_decay_mult=0,
-        dwconv_decay_mult=0.1,
-        dcn_offset_lr_mult=0.1)
-    optim_constructor_cfg = dict(
-        type='DefaultOptimizerConstructor',
-        optimizer_cfg=optimizer_cfg,
-        paramwise_cfg=paramwise_cfg)
-    optim_constructor = build_optimizer_constructor(optim_constructor_cfg)
-    optimizer = optim_constructor(model)
-    check_sgd_optimizer(optimizer, model, **paramwise_cfg)
-    from mmcv.runner import OPTIMIZERS
-    from mmcv.utils import build_from_cfg
-    @OPTIMIZER_BUILDERS.register_module()
-    class MyOptimizerConstructor(DefaultOptimizerConstructor):
-        def __call__(self, model):
-            if hasattr(model, 'module'):
-                model = model.module
-            conv1_lr_mult = self.paramwise_cfg.get('conv1_lr_mult', 1.)
-            params = []
-            for name, param in model.named_parameters():
-                param_group = {'params': [param]}
-                if name.startswith('conv1') and param.requires_grad:
-                    param_group['lr'] = self.base_lr * conv1_lr_mult
-                params.append(param_group)
-            optimizer_cfg['params'] = params
-            return build_from_cfg(optimizer_cfg, OPTIMIZERS)
-    paramwise_cfg = dict(conv1_lr_mult=5)
-    optim_constructor_cfg = dict(
-        type='MyOptimizerConstructor',
-        optimizer_cfg=optimizer_cfg,
-        paramwise_cfg=paramwise_cfg)
-    optim_constructor = build_optimizer_constructor(optim_constructor_cfg)
-    optimizer = optim_constructor(model)
-    param_groups = optimizer.param_groups
-    assert isinstance(optimizer, torch.optim.SGD)
-    assert optimizer.defaults['lr'] == base_lr
-    assert optimizer.defaults['momentum'] == momentum
-    assert optimizer.defaults['weight_decay'] == base_wd
-    for i, param in enumerate(model.parameters()):
-        param_group = param_groups[i]
-        assert torch.equal(param_group['params'][0], param)
-        assert param_group['momentum'] == momentum
-    # conv1.weight
-    assert param_groups[1]['lr'] == base_lr * paramwise_cfg['conv1_lr_mult']
-    assert param_groups[1]['weight_decay'] == base_wd
-def test_build_optimizer():
-    model = ExampleModel()
-    optimizer_cfg = dict(
-        type='SGD', lr=base_lr, weight_decay=base_wd, momentum=momentum)
-    optimizer = build_optimizer(model, optimizer_cfg)
-    check_default_optimizer(optimizer, model)
-    model = ExampleModel()
-    optimizer_cfg = dict(
-        type='SGD',
-        lr=base_lr,
-        weight_decay=base_wd,
-        momentum=momentum,
-        paramwise_cfg=dict(
-            bias_lr_mult=2,
-            bias_decay_mult=0.5,
-            norm_decay_mult=0,
-            dwconv_decay_mult=0.1,
-            dcn_offset_lr_mult=0.1))
-    optimizer = build_optimizer(model, optimizer_cfg)
-    check_sgd_optimizer(optimizer, model, **optimizer_cfg['paramwise_cfg'])
--- a/tests/test_runner/test_runner.py
+++ b/tests/test_runner/test_runner.py
-# Copyright (c) OpenMMLab. All rights reserved.
-import logging
-import os
-import os.path as osp
-import platform
-import random
-import string
-import tempfile
-import pytest
-import torch
-import torch.nn as nn
-from mmcv.parallel import MMDataParallel
-from mmcv.runner import (RUNNERS, EpochBasedRunner, IterBasedRunner,
-                         build_runner)
-from mmcv.runner.hooks import IterTimerHook
-class OldStyleModel(nn.Module):
-    def __init__(self):
-        super().__init__()
-        self.conv = nn.Conv2d(3, 3, 1)
-class Model(OldStyleModel):
-    def train_step(self):
-        pass
-    def val_step(self):
-        pass
-def test_build_runner():
-    temp_root = tempfile.gettempdir()
-    dir_name = ''.join(
-        [random.choice(string.ascii_letters) for _ in range(10)])
-    default_args = dict(
-        model=Model(),
-        work_dir=osp.join(temp_root, dir_name),
-        logger=logging.getLogger())
-    cfg = dict(type='EpochBasedRunner', max_epochs=1)
-    runner = build_runner(cfg, default_args=default_args)
-    assert runner._max_epochs == 1
-    cfg = dict(type='IterBasedRunner', max_iters=1)
-    runner = build_runner(cfg, default_args=default_args)
-    assert runner._max_iters == 1
-    with pytest.raises(ValueError, match='Only one of'):
-        cfg = dict(type='IterBasedRunner', max_epochs=1, max_iters=1)
-        runner = build_runner(cfg, default_args=default_args)
-@pytest.mark.parametrize('runner_class', RUNNERS.module_dict.values())
-def test_epoch_based_runner(runner_class):
-    with pytest.warns(DeprecationWarning):
-        # batch_processor is deprecated
-        model = OldStyleModel()
-        def batch_processor():
-            pass
-        _ = runner_class(model, batch_processor, logger=logging.getLogger())
-    with pytest.raises(TypeError):
-        # batch_processor must be callable
-        model = OldStyleModel()
-        _ = runner_class(model, batch_processor=0, logger=logging.getLogger())
-    with pytest.raises(TypeError):
-        # optimizer must be a optimizer or a dict of optimizers
-        model = Model()
-        optimizer = 'NotAOptimizer'
-        _ = runner_class(
-            model, optimizer=optimizer, logger=logging.getLogger())
-    with pytest.raises(TypeError):
-        # optimizer must be a optimizer or a dict of optimizers
-        model = Model()
-        optimizers = dict(optim1=torch.optim.Adam(), optim2='NotAOptimizer')
-        _ = runner_class(
-            model, optimizer=optimizers, logger=logging.getLogger())
-    with pytest.raises(TypeError):
-        # logger must be a logging.Logger
-        model = Model()
-        _ = runner_class(model, logger=None)
-    with pytest.raises(TypeError):
-        # meta must be a dict or None
-        model = Model()
-        _ = runner_class(model, logger=logging.getLogger(), meta=['list'])
-    with pytest.raises(AssertionError):
-        # model must implement the method train_step()
-        model = OldStyleModel()
-        _ = runner_class(model, logger=logging.getLogger())
-    with pytest.raises(TypeError):
-        # work_dir must be a str or None
-        model = Model()
-        _ = runner_class(model, work_dir=1, logger=logging.getLogger())
-    with pytest.raises(RuntimeError):
-        # batch_processor and train_step() cannot be both set
-        def batch_processor():
-            pass
-        model = Model()
-        _ = runner_class(model, batch_processor, logger=logging.getLogger())
-    # test work_dir
-    model = Model()
-    temp_root = tempfile.gettempdir()
-    dir_name = ''.join(
-        [random.choice(string.ascii_letters) for _ in range(10)])
-    work_dir = osp.join(temp_root, dir_name)
-    _ = runner_class(model, work_dir=work_dir, logger=logging.getLogger())
-    assert osp.isdir(work_dir)
-    _ = runner_class(model, work_dir=work_dir, logger=logging.getLogger())
-    assert osp.isdir(work_dir)
-    os.removedirs(work_dir)
-@pytest.mark.parametrize('runner_class', RUNNERS.module_dict.values())
-def test_runner_with_parallel(runner_class):
-    def batch_processor():
-        pass
-    model = MMDataParallel(OldStyleModel())
-    _ = runner_class(model, batch_processor, logger=logging.getLogger())
-    model = MMDataParallel(Model())
-    _ = runner_class(model, logger=logging.getLogger())
-    with pytest.raises(RuntimeError):
-        # batch_processor and train_step() cannot be both set
-        def batch_processor():
-            pass
-        model = MMDataParallel(Model())
-        _ = runner_class(model, batch_processor, logger=logging.getLogger())
-@pytest.mark.parametrize('runner_class', RUNNERS.module_dict.values())
-def test_save_checkpoint(runner_class):
-    model = Model()
-    runner = runner_class(model=model, logger=logging.getLogger())
-    with pytest.raises(TypeError):
-        # meta should be None or dict
-        runner.save_checkpoint('.', meta=list())
-    with tempfile.TemporaryDirectory() as root:
-        runner.save_checkpoint(root)
-        latest_path = osp.join(root, 'latest.pth')
-        assert osp.exists(latest_path)
-        if isinstance(runner, EpochBasedRunner):
-            first_ckp_path = osp.join(root, 'epoch_1.pth')
-        elif isinstance(runner, IterBasedRunner):
-            first_ckp_path = osp.join(root, 'iter_1.pth')
-        assert osp.exists(first_ckp_path)
-        if platform.system() != 'Windows':
-            assert osp.realpath(latest_path) == osp.realpath(first_ckp_path)
-        else:
-            # use copy instead of symlink on windows
-            pass
-        torch.load(latest_path)
-@pytest.mark.parametrize('runner_class', RUNNERS.module_dict.values())
-def test_build_lr_momentum_hook(runner_class):
-    model = Model()
-    runner = runner_class(model=model, logger=logging.getLogger())
-    # test policy that is already title
-    lr_config = dict(
-        policy='CosineAnnealing',
-        by_epoch=False,
-        min_lr_ratio=0,
-        warmup_iters=2,
-        warmup_ratio=0.9)
-    runner.register_lr_hook(lr_config)
-    assert len(runner.hooks) == 1
-    # test policy that is already title
-    lr_config = dict(
-        policy='Cyclic',
-        by_epoch=False,
-        target_ratio=(10, 1),
-        cyclic_times=1,
-        step_ratio_up=0.4)
-    runner.register_lr_hook(lr_config)
-    assert len(runner.hooks) == 2
-    # test policy that is not title
-    lr_config = dict(
-        policy='cyclic',
-        by_epoch=False,
-        target_ratio=(0.85 / 0.95, 1),
-        cyclic_times=1,
-        step_ratio_up=0.4)
-    runner.register_lr_hook(lr_config)
-    assert len(runner.hooks) == 3
-    # test policy that is title
-    lr_config = dict(
-        policy='Step',
-        warmup='linear',
-        warmup_iters=500,
-        warmup_ratio=1.0 / 3,
-        step=[8, 11])
-    runner.register_lr_hook(lr_config)
-    assert len(runner.hooks) == 4
-    # test policy that is not title
-    lr_config = dict(
-        policy='step',
-        warmup='linear',
-        warmup_iters=500,
-        warmup_ratio=1.0 / 3,
-        step=[8, 11])
-    runner.register_lr_hook(lr_config)
-    assert len(runner.hooks) == 5
-    # test policy that is already title
-    mom_config = dict(
-        policy='CosineAnnealing',
-        min_momentum_ratio=0.99 / 0.95,
-        by_epoch=False,
-        warmup_iters=2,
-        warmup_ratio=0.9 / 0.95)
-    runner.register_momentum_hook(mom_config)
-    assert len(runner.hooks) == 6
-    # test policy that is already title
-    mom_config = dict(
-        policy='Cyclic',
-        by_epoch=False,
-        target_ratio=(0.85 / 0.95, 1),
-        cyclic_times=1,
-        step_ratio_up=0.4)
-    runner.register_momentum_hook(mom_config)
-    assert len(runner.hooks) == 7
-    # test policy that is already title
-    mom_config = dict(
-        policy='cyclic',
-        by_epoch=False,
-        target_ratio=(0.85 / 0.95, 1),
-        cyclic_times=1,
-        step_ratio_up=0.4)
-    runner.register_momentum_hook(mom_config)
-    assert len(runner.hooks) == 8
-@pytest.mark.parametrize('runner_class', RUNNERS.module_dict.values())
-def test_register_timer_hook(runner_class):
-    model = Model()
-    runner = runner_class(model=model, logger=logging.getLogger())
-    # test register None
-    timer_config = None
-    runner.register_timer_hook(timer_config)
-    assert len(runner.hooks) == 0
-    # test register IterTimerHook with config
-    timer_config = dict(type='IterTimerHook')
-    runner.register_timer_hook(timer_config)
-    assert len(runner.hooks) == 1
-    assert isinstance(runner.hooks[0], IterTimerHook)
-    # test register IterTimerHook
-    timer_config = IterTimerHook()
-    runner.register_timer_hook(timer_config)
-    assert len(runner.hooks) == 2
-    assert isinstance(runner.hooks[1], IterTimerHook)
--- a/tests/test_runner/test_utils.py
+++ b/tests/test_runner/test_utils.py
-# Copyright (c) OpenMMLab. All rights reserved.
-import os
-import random
-import numpy as np
-import torch
-from mmcv.runner import set_random_seed
-from mmcv.utils import TORCH_VERSION, digit_version
-is_rocm_pytorch = False
-if digit_version(TORCH_VERSION) >= digit_version('1.5'):
-    from torch.utils.cpp_extension import ROCM_HOME
-    is_rocm_pytorch = True if ((torch.version.hip is not None) and
-                               (ROCM_HOME is not None)) else False
-def test_set_random_seed():
-    set_random_seed(0)
-    a_random = random.randint(0, 10)
-    a_np_random = np.random.rand(2, 2)
-    a_torch_random = torch.rand(2, 2)
-    assert torch.backends.cudnn.deterministic is False
-    assert torch.backends.cudnn.benchmark is False
-    assert os.environ['PYTHONHASHSEED'] == str(0)
-    set_random_seed(0, True)
-    b_random = random.randint(0, 10)
-    b_np_random = np.random.rand(2, 2)
-    b_torch_random = torch.rand(2, 2)
-    assert torch.backends.cudnn.deterministic is True
-    if is_rocm_pytorch:
-        assert torch.backends.cudnn.benchmark is True
-    else:
-        assert torch.backends.cudnn.benchmark is False
-    assert a_random == b_random
-    assert np.equal(a_np_random, b_np_random).all()
-    assert torch.equal(a_torch_random, b_torch_random)
--- a/tests/test_utils/test_hub.py
+++ b/tests/test_utils/test_hub.py
-# Copyright (c) OpenMMLab. All rights reserved.
-import pytest
-import torch
-from torch.utils import model_zoo
-from mmcv.utils import TORCH_VERSION, digit_version, load_url
-@pytest.mark.skipif(
-    torch.__version__ == 'parrots', reason='not necessary in parrots test')
-def test_load_url():
-    url1 = 'https://download.openmmlab.com/mmcv/test_data/saved_in_pt1.5.pth'
-    url2 = 'https://download.openmmlab.com/mmcv/test_data/saved_in_pt1.6.pth'
-    # The 1.6 release of PyTorch switched torch.save to use a new zipfile-based
-    # file format. It will cause RuntimeError when a checkpoint was saved in
-    # torch >= 1.6.0 but loaded in torch < 1.7.0.
-    # More details at https://github.com/open-mmlab/mmpose/issues/904
-    if digit_version(TORCH_VERSION) < digit_version('1.7.0'):
-        model_zoo.load_url(url1)
-        with pytest.raises(RuntimeError):
-            model_zoo.load_url(url2)
-    else:
-        # high version of PyTorch can load checkpoints from url, regardless
-        # of which version they were saved in
-        model_zoo.load_url(url1)
-        model_zoo.load_url(url2)
-    load_url(url1)
-    # if a checkpoint was saved in torch >= 1.6.0 but loaded in torch < 1.5.0,
-    # it will raise a RuntimeError
-    if digit_version(TORCH_VERSION) < digit_version('1.5.0'):
-        with pytest.raises(RuntimeError):
-            load_url(url2)
-    else:
-        load_url(url2)