Fix index out of range error when parameter count is not multiple of ranks (#202)

512a0d4d · Olatunji Ruwase · GitHub · c014a55b · 512a0d4d · 512a0d4d
Unverified Commit 512a0d4d authored Apr 24, 2020 by Olatunji Ruwase Committed by GitHub Apr 24, 2020
Hide whitespace changes
Inline Side-by-side

Showing with 37 additions and 0 deletions

deepspeed/pt/deepspeed_zero_optimizer.py deepspeed/pt/deepspeed_zero_optimizer.py +7 -0

tests/unit/test_fp16.py tests/unit/test_fp16.py +30 -0

No files found.
--- a/deepspeed/pt/deepspeed_zero_optimizer.py
+++ b/deepspeed/pt/deepspeed_zero_optimizer.py
@@ -264,6 +264,13 @@ class FP16_DeepSpeedZeroOptimizer(object):
        flat_tensor_list = []
        current_size = 0

+        if not tensor_list:
+            flat_tensor_list.append(
+                torch.zeros(int(partition_size),
+                            dtype=dtype,
+                            device=torch.cuda.current_device()))
+            return _flatten_dense_tensors(flat_tensor_list)
+
        if dtype is None:
            dtype = tensor_list[0].dtype


--- a/tests/unit/test_fp16.py
+++ b/tests/unit/test_fp16.py
@@ -315,3 +315,33 @@ def test_zero_allow_untested_optimizer(tmpdir):
                                                    model_parameters=model.parameters())

    _test_zero_allow_untested_optimizer(args)
+
+
+def test_zero_empty_partition(tmpdir):
+    config_dict = {
+        "train_batch_size": 3,
+        "fp16": {
+            "enabled": True
+        },
+        "optimizer": {
+            "type": "Adam",
+            "params": {
+                "lr": 0.00015
+            }
+        },
+        "zero_optimization": True
+    }
+    args = args_from_dict(tmpdir, config_dict)
+
+    @distributed_test(world_size=[3])
+    def _test_zero_empty_partition(args):
+        hidden_dim = 1
+        model = SimpleModel(hidden_dim)
+        # Ensure model has 2 parameters, to cause empty partition with DP=3
+        assert len(list(model.parameters())) == 2
+        model, _, _, _ = deepspeed.initialize(args=args,
+                                              model=model,
+                                              model_parameters=model.parameters())
+        model.step()
+
+    _test_zero_empty_partition(args)