[zero] use colo model data api in optimv2 (#511)

bca0c49a · Jiarui Fang · GitHub · 9330be0f · bca0c49a
Unverified Commit bca0c49a authored Mar 24, 2022 by Jiarui Fang Committed by GitHub Mar 24, 2022
Hide whitespace changes
Inline Side-by-side

Showing with 3 additions and 3 deletions

colossalai/zero/sharded_optim/sharded_optim_v2.py colossalai/zero/sharded_optim/sharded_optim_v2.py +3 -3

No files found.
--- a/colossalai/zero/sharded_optim/sharded_optim_v2.py
+++ b/colossalai/zero/sharded_optim/sharded_optim_v2.py
@@ -15,8 +15,8 @@ from torch import Tensor
 from torch.distributed import ProcessGroup
 from torch.nn.parameter import Parameter
 from torch.optim import Optimizer
+from colossalai.zero.sharded_optim._utils import has_inf_or_nan
-from ._utils import has_inf_or_nan
+from colossalai.utils.memory_utils.utils import colo_model_data_tensor_move
 class OptimState(Enum):
@@ -161,7 +161,7 @@ class ShardedOptimizerV2(ColossalaiOptimizer):
                # Since p.data is fp32 and p.col_attr.sharded_data_tensor is fp16
                # TODO() optimize this line CPU (fp32) -> GPU (fp16)
-                p.col_attr.sharded_data_tensor.copy_payload(p.data)
+                colo_model_data_tensor_move(p, p.col_attr.sharded_data_tensor)
                if not is_param_sharded:
                    # We gather full fp16 param here