[Dist][Optim] Change op order in SparseAdagrad to be numerically closer to PyTorch (#4253)

Signed-off-by: Serge Panev <spanev@nvidia.com> Co-authored-by: Mufei Li <mufeili1996@gmail.com>

[Dist][Optim] Change op order in SparseAdagrad to be numerically closer to PyTorch (#4253)
Signed-off-by: Serge Panev <spanev@nvidia.com> Co-authored-by: Mufei Li <mufeili1996@gmail.com>
7cd531c4 · Serge Panev · GitHub · 8292bf32 · 7cd531c4
Unverified Commit 7cd531c4 authored Jul 24, 2022 by Serge Panev Committed by GitHub Jul 25, 2022
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

python/dgl/distributed/optim/pytorch/sparse_optim.py python/dgl/distributed/optim/pytorch/sparse_optim.py +1 -1

No files found.
--- a/python/dgl/distributed/optim/pytorch/sparse_optim.py
+++ b/python/dgl/distributed/optim/pytorch/sparse_optim.py
@@ -255,7 +255,7 @@ class SparseAdagrad(DistSparseGradOptimizer):
            update_event.record()
        # update emb
-        std_values = grad_state.add_(eps).sqrt_()
+        std_values = grad_state.sqrt_().add_(eps)
        tmp = clr * grad_values / std_values
        tmp_dst = tmp.to(state_dev, non_blocking=True)