Small logger bug (multi-gpu, distribution) in training

d55c3ae8 · VictorSanh · 3d291dea · d55c3ae8 · d55c3ae8
Commit d55c3ae8 authored Nov 04, 2018 by VictorSanh
Show whitespace changes
Inline Side-by-side

Showing with 2 additions and 2 deletions

run_classifier.py run_classifier.py +1 -1

run_squad.py run_squad.py +1 -1

No files found.
--- a/run_classifier.py
+++ b/run_classifier.py
@@ -420,7 +420,7 @@ def main():
        n_gpu = 1
        # Initializes the distributed backend which will take care of sychronizing nodes/GPUs
        torch.distributed.init_process_group(backend='nccl')
-    logger.info("device", device, "n_gpu", n_gpu, "distributed training", bool(args.local_rank != -1))
+    logger.info("device %s n_gpu %d distributed training %r", device, n_gpu, bool(args.local_rank != -1))
    if args.accumulate_gradients < 1:
        raise ValueError("Invalid accumulate_gradients parameter: {}, should be >= 1".format(

--- a/run_squad.py
+++ b/run_squad.py
@@ -750,7 +750,7 @@ def main():
        n_gpu = 1
        # Initializes the distributed backend which will take care of sychronizing nodes/GPUs
        torch.distributed.init_process_group(backend='nccl')
-    logger.info("device", device, "n_gpu", n_gpu, "distributed training", bool(args.local_rank != -1))
+    logger.info("device %s n_gpu %d distributed training %r", device, n_gpu, bool(args.local_rank != -1))
    if args.accumulate_gradients < 1:
        raise ValueError("Invalid accumulate_gradients parameter: {}, should be >= 1".format(