fix prepare grads in sharded optim (#749)

4b048a87 · ver217 · GitHub · 09777254 · 4b048a87
Unverified Commit 4b048a87 authored Apr 13, 2022 by ver217 Committed by GitHub Apr 13, 2022
Hide whitespace changes
Inline Side-by-side

Showing with 2 additions and 0 deletions

colossalai/zero/sharded_optim/sharded_optim_v2.py colossalai/zero/sharded_optim/sharded_optim_v2.py +2 -0

No files found.
--- a/colossalai/zero/sharded_optim/sharded_optim_v2.py
+++ b/colossalai/zero/sharded_optim/sharded_optim_v2.py
@@ -288,6 +288,8 @@ class ShardedOptimizerV2(ColossalaiOptimizer):
    def _prepare_grads(self):
        for group in self.optim.param_groups:
            for p in group['params']:
+                if p.colo_attr.saved_grad.is_null():
+                    continue
                p.colo_attr.saved_grad.trans_state(TensorState.COMPUTE)
                # FIXME(ver217): p.data here is an empty tensor on CUDA and has no useful infomation
                # If we change p.grad directly