fix bug with padding mask + add corresponding test

da10de84 · Rémi Louf · 3b0d2fa3 · da10de84 · da10de84
Commit da10de84 authored Oct 30, 2019 by Rémi Louf
Hide whitespace changes
Inline Side-by-side

Showing with 10 additions and 3 deletions

examples/utils_summarization.py examples/utils_summarization.py +3 -3

examples/utils_summarization_test.py examples/utils_summarization_test.py +7 -0

No files found.
--- a/examples/utils_summarization.py
+++ b/examples/utils_summarization.py
@@ -127,9 +127,9 @@ def build_lm_labels(sequence, pad_token):
 def build_mask(sequence, pad_token):
    """ Builds the mask. The attention mechanism will only attend to positions
    with value 1. """
-    mask = sequence.clone()
+    mask = torch.ones_like(sequence)
-    mask[mask != pad_token] = 1
+    idx_pad_tokens = (sequence == pad_token)
-    mask[mask == pad_token] = 0
+    mask[idx_pad_tokens] = 0
    return mask

--- a/examples/utils_summarization_test.py
+++ b/examples/utils_summarization_test.py
@@ -116,6 +116,13 @@ class SummarizationDataProcessingTest(unittest.TestCase):
            build_mask(sequence, 23).numpy(), expected.numpy()
        )
+    def test_build_mask_with_padding_equal_to_one(self):
+        sequence = torch.tensor([8, 2, 3, 4, 1, 1, 1])
+        expected = torch.tensor([1, 1, 1, 1, 0, 0, 0])
+        np.testing.assert_array_equal(
+            build_mask(sequence, 1).numpy(), expected.numpy()
+        )
    def test_compute_token_type_ids(self):
        separator = 101
        batch = torch.tensor(