Bug fix

3ccdfaa3 · Thor Johnsen · 3bae8c83 · 3ccdfaa3
Commit 3ccdfaa3 authored May 22, 2020 by Thor Johnsen
Hide whitespace changes
Inline Side-by-side

Showing with 5 additions and 3 deletions

apex/contrib/optimizers/distributed_fused_adam.py apex/contrib/optimizers/distributed_fused_adam.py +5 -3

No files found.
--- a/apex/contrib/optimizers/distributed_fused_adam.py
+++ b/apex/contrib/optimizers/distributed_fused_adam.py
@@ -264,9 +264,11 @@ class DistributedFusedAdam(torch.optim.Optimizer):
                grp = torch.distributed.new_group(ranks=ranks)
                if torch.distributed.get_rank() in ranks:
                    self._rs_pg.append(grp)
-            if self._compute_L2_grad_norm and torch.distributed.get_rank() in ranks:
+            if self._compute_L2_grad_norm:
-                self._l2_grad_norm_pg = torch.distributed.new_group(ranks=ranks)
+                l2_grad_norm_pg = torch.distributed.new_group(ranks=ranks)
-                torch.distributed.all_reduce(self._overflow_buf,group=self._l2_grad_norm_pg)
+                if torch.distributed.get_rank() in ranks:
+                    self._l2_grad_norm_pg = l2_grad_norm_pg
+                    torch.distributed.all_reduce(self._overflow_buf,group=self._l2_grad_norm_pg)
        self._rs_st = [torch.cuda.Stream() for _ in range(self._num_rs_pg)]
        for rs_pg in self._rs_pg:
            torch.distributed.all_reduce(self._overflow_buf,group=rs_pg)