[docs][minor] fixing the readme example for oss (#147)

* fixing the readme for oss

[docs][minor] fixing the readme example for oss (#147)
* fixing the readme for oss
58e97aa6 · Benjamin Lefaudeux · GitHub · 10062e58 · 58e97aa6 · 58e97aa6
Unverified Commit 58e97aa6 authored Oct 17, 2020 by Benjamin Lefaudeux Committed by GitHub Oct 17, 2020
Show whitespace changes
Inline Side-by-side

Showing with 5 additions and 4 deletions

README.md README.md +5 -3

docs/source/tutorials/oss.rst docs/source/tutorials/oss.rst +0 -1

No files found.
--- a/README.md
+++ b/README.md
@@ -56,6 +56,7 @@ See a more complete example [here](https://github.com/facebookresearch/fairscale
 import torch
 import torch.multiprocessing as mp
 from fairscale.optim.oss import OSS
+from torch.nn.parallel import DistributedDataParallel as DDP
 def train(
    rank: int,
@@ -66,7 +67,8 @@ def train(
    dist_init(rank, world_size)
    # Problem statement
-    model = myAwesomeModel()
+    model = myAwesomeModel().to(rank)
+    model = DDP(model, device_ids=[rank])
    dataloader = mySuperFastDataloader()
    loss_fn = myVeryRelevantLoss()
    base_optimizer = torch.optim.SGD # pick any pytorch compliant optimizer here
@@ -82,11 +84,11 @@ def train(
            model.zero_grad()
            outputs = model(batch["inputs"])
            loss = loss_fn(outputs, batch["label"])
-            torch.distributed.all_reduce(loss, op=torch.distributed.ReduceOp.SUM)
-            loss /= world_size
            loss.backward()
            optimizer.step()
+    dist.destroy_process_group()
 if __name__ == "__main__":
    # Supposing that WORLD_SIZE and EPOCHS are somehow defined somewhere
    mp.spawn(

--- a/docs/source/tutorials/oss.rst
+++ b/docs/source/tutorials/oss.rst
@@ -40,7 +40,6 @@ Let's suppose that your trainer looks like
                model.zero_grad()
                outputs = model(data)
                loss = loss_fn(outputs, target)
-                loss /= world_size
                loss.backward()
                optimizer.step()