Fixed fp16_optimizer state bug (#580)

c80e4cae · wdmwhh · GitHub · acee61d7 · c80e4cae
Unverified Commit c80e4cae authored Sep 28, 2020 by wdmwhh Committed by GitHub Sep 28, 2020
Hide whitespace changes
Inline Side-by-side

Showing with 10 additions and 0 deletions

mmcv/runner/hooks/optimizer.py mmcv/runner/hooks/optimizer.py +10 -0

No files found.
--- a/mmcv/runner/hooks/optimizer.py
+++ b/mmcv/runner/hooks/optimizer.py
 # Copyright (c) Open-MMLab. All rights reserved.
 import copy
+from collections import defaultdict
+from itertools import chain
 from torch.nn.utils import clip_grad
@@ -67,8 +69,16 @@ class Fp16OptimizerHook(OptimizerHook):
        2. Convert the main model from fp32 to fp16.
        """
        # keep a copy of fp32 weights
+        old_groups = runner.optimizer.param_groups
        runner.optimizer.param_groups = copy.deepcopy(
            runner.optimizer.param_groups)
+        state = defaultdict(dict)
+        p_map = {old_p: p for old_p, p in
+                 zip(chain(*(g['params'] for g in old_groups)),
+                     chain(*(g['params'] for g in runner.optimizer.param_groups)))}
+        for k, v in runner.optimizer.state.items():
+            state[p_map[k]] = v
+        runner.optimizer.state = state
        # convert model to fp16
        wrap_fp16_model(runner.model)