[Fix] Fix wrong iter number and progress number in the logging during val/test time (#914)

* Remove iter number in logging during val/test time * Fix typo * modified EvalHook for eval mode to print the correct iter number

[Fix] Fix wrong iter number and progress number in the logging during val/test time (#914)
* Remove iter number in logging during val/test time * Fix typo * modified EvalHook for eval mode to print the correct iter number
b36c4de1 · Yezhen Cong · GitHub · a1d3bf1c · b36c4de1 · b36c4de1
Unverified Commit b36c4de1 authored May 13, 2021 by Yezhen Cong Committed by GitHub May 13, 2021
Showing with 17 additions and 2 deletions

mmcv/engine/test.py mmcv/engine/test.py +4 -1

mmcv/runner/hooks/evaluation.py mmcv/runner/hooks/evaluation.py +2 -0

mmcv/runner/hooks/logger/text.py mmcv/runner/hooks/logger/text.py +11 -1

No files found.
--- a/mmcv/engine/test.py
+++ b/mmcv/engine/test.py
@@ -73,7 +73,10 @@ def multi_gpu_test(model, data_loader, tmpdir=None, gpu_collect=False):
        if rank == 0:
            batch_size = len(result)
-            for _ in range(batch_size * world_size):
+            batch_size_all = batch_size * world_size
+            if batch_size_all + prog_bar.completed > len(dataset):
+                batch_size_all = len(dataset) - prog_bar.completed
+            for _ in range(batch_size_all):
                prog_bar.update()
    # collect results from all ranks

--- a/mmcv/runner/hooks/evaluation.py
+++ b/mmcv/runner/hooks/evaluation.py
@@ -180,6 +180,7 @@ class EvalHook(Hook):
        from mmcv.engine import single_gpu_test
        results = single_gpu_test(runner.model, self.dataloader)
+        runner.log_buffer.output['eval_iter_num'] = len(self.dataloader)
        key_score = self.evaluate(runner, results)
        if self.save_best:
            self._save_ckpt(runner, key_score)
@@ -371,6 +372,7 @@ class DistEvalHook(EvalHook):
            gpu_collect=self.gpu_collect)
        if runner.rank == 0:
            print('\n')
+            runner.log_buffer.output['eval_iter_num'] = len(self.dataloader)
            key_score = self.evaluate(runner, results)
            if self.save_best:

--- a/mmcv/runner/hooks/logger/text.py
+++ b/mmcv/runner/hooks/logger/text.py
@@ -99,6 +99,10 @@ class TextLoggerHook(LoggerHook):
                if torch.cuda.is_available():
                    log_str += f'memory: {log_dict["memory"]}, '
        else:
+            # val/test time
+            # here 1000 is the length of the val dataloader
+            # by epoch: Epoch[val] [4][1000]
+            # by iter: Iter[val] [1000]
            if self.by_epoch:
                log_str = f'Epoch({log_dict["mode"]}) ' \
                    f'[{log_dict["epoch"]}][{log_dict["iter"]}]\t'
@@ -141,10 +145,16 @@ class TextLoggerHook(LoggerHook):
            return items
    def log(self, runner):
+        if 'eval_iter_num' in runner.log_buffer.output:
+            # this doesn't modify runner.iter and is regardless of by_epoch
+            cur_iter = runner.log_buffer.output.pop('eval_iter_num')
+        else:
+            cur_iter = self.get_iter(runner, inner_iter=True)
        log_dict = OrderedDict(
            mode=self.get_mode(runner),
            epoch=self.get_epoch(runner),
-            iter=self.get_iter(runner, inner_iter=True))
+            iter=cur_iter)
        # only record lr of the first param group
        cur_lr = runner.current_lr()