polish code

56636169 · jiaruifang · Frank Lee · d271f259 · 56636169
Commit 56636169 authored Mar 09, 2022 by jiaruifang Committed by Frank Lee Mar 11, 2022
Hide whitespace changes
Inline Side-by-side

Showing with 2 additions and 4 deletions

colossalai/zero/sharded_model/sharded_model_v2.py colossalai/zero/sharded_model/sharded_model_v2.py +2 -4

No files found.
--- a/colossalai/zero/sharded_model/sharded_model_v2.py
+++ b/colossalai/zero/sharded_model/sharded_model_v2.py
@@ -18,8 +18,7 @@ from torch.distributed import ProcessGroup
 from torch.nn.parameter import Parameter
 from ._zero3_utils import (cast_tensor_to_fp32, chunk_and_pad, get_gradient_predivide_factor)
+from ._zero3_utils import (cast_float_arguments, cast_tensor_to_fp16)
-# from ._zero3_utils import cast_float_arguments, cast_tensor_to_fp16
 class ShardedModelV2(nn.Module):
@@ -80,8 +79,7 @@ class ShardedModelV2(nn.Module):
        self._require_backward_grad_sync: bool = True
    def forward(self, *args: Any, **kwargs: Any) -> torch.Tensor:
-        # TODO args can be Long!
+        args, kwargs = cast_float_arguments(cast_tensor_to_fp16, *args, **kwargs)
-        # args, kwargs = cast_float_arguments(cast_tensor_to_fp16, *args, **kwargs)
        outputs = self.module(*args, **kwargs)
        return outputs