Fix error when training multilingual_translation task with multi-GPU

Summary: D10052908 introduce multilingual_translation task, but it raises exception when training with multiple-GPUs: P60202593 With Myle's help, we found that it is because of improperly handled dummy batch data type, and it causes optimizer.backward() is not executed same number of times cross different GPUs. Reviewed By: xianxl Differential Revision: D12964263 fbshipit-source-id: 4991039030bf373f0c484e131acc4736487be4d8

Fix error when training multilingual_translation task with multi-GPU
Summary: D10052908 introduce multilingual_translation task, but it raises exception when training with multiple-GPUs: P60202593 With Myle's help, we found that it is because of improperly handled dummy batch data type, and it causes optimizer.backward() is not executed same number of times cross different GPUs. Reviewed By: xianxl Differential Revision: D12964263 fbshipit-source-id: 4991039030bf373f0c484e131acc4736487be4d8
189fcabf · Peng-Jen Chen · Facebook Github Bot · 8eb232ce · 189fcabf
Commit 189fcabf authored Nov 08, 2018 by Peng-Jen Chen Committed by Facebook Github Bot Nov 08, 2018
Hide whitespace changes
Inline Side-by-side

Showing with 2 additions and 0 deletions

fairseq/data/round_robin_zip_datasets.py fairseq/data/round_robin_zip_datasets.py +2 -0

No files found.
--- a/fairseq/data/round_robin_zip_datasets.py
+++ b/fairseq/data/round_robin_zip_datasets.py
@@ -59,6 +59,8 @@ class RoundRobinZipDatasets(FairseqDataset):
    def collater(self, samples):
        """Merge a list of samples to form a mini-batch."""
+        if len(samples) == 0:
+            return None
        if self.eval_key is None:
            return OrderedDict([
                (key, dataset.collater([sample[key] for sample in samples]))