Fix indexing in TokenBlockDataset

Summary: Pull Request resolved: https://github.com/pytorch/fairseq/pull/719 Differential Revision: D15258483 Pulled By: myleott fbshipit-source-id: dd00daa6f1c87264c1196a77dfffc8c876ebde7f

Fix indexing in TokenBlockDataset
Summary: Pull Request resolved: https://github.com/pytorch/fairseq/pull/719 Differential Revision: D15258483 Pulled By: myleott fbshipit-source-id: dd00daa6f1c87264c1196a77dfffc8c876ebde7f
eddcdf08 · Myle Ott · Facebook Github Bot · 0cb45bcb · eddcdf08
Commit eddcdf08 authored May 08, 2019 by Myle Ott Committed by Facebook Github Bot May 08, 2019
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

fairseq/data/token_block_dataset.py fairseq/data/token_block_dataset.py +1 -1

No files found.
--- a/fairseq/data/token_block_dataset.py
+++ b/fairseq/data/token_block_dataset.py
@@ -70,7 +70,7 @@ class TokenBlockDataset(FairseqDataset):
            if not torch.is_tensor(sizes):
                sizes = torch.tensor(sizes)
            cumsum = torch.cumsum(sizes, dim=0)
-            self.slice_indices[0, 1] = sizes[0]
+            self.slice_indices[0] = [0, sizes[0]]
            self.slice_indices[1:] = cumsum.unfold(0, 2, 1)
        else:
            raise ValueError('Invalid break_mode: ' + break_mode)