Fix BART tests on GPU (#4298)

4bf50422 · Julien Chaumond · GitHub · e4512aab · 4bf50422 · 4bf50422
Unverified Commit 4bf50422 authored May 12, 2020 by Julien Chaumond Committed by GitHub May 12, 2020
Hide whitespace changes
Inline Side-by-side

Showing with 6 additions and 2 deletions

src/transformers/modeling_bart.py src/transformers/modeling_bart.py +1 -1

tests/test_modeling_bart.py tests/test_modeling_bart.py +5 -1

No files found.
--- a/src/transformers/modeling_bart.py
+++ b/src/transformers/modeling_bart.py
@@ -886,7 +886,7 @@ class BartForConditionalGeneration(PretrainedBartModel):
        if new_num_tokens <= old_num_tokens:
            new_bias = self.final_logits_bias[:, :new_num_tokens]
        else:
-            extra_bias = torch.zeros((1, new_num_tokens - old_num_tokens))
+            extra_bias = torch.zeros((1, new_num_tokens - old_num_tokens), device=self.final_logits_bias.device)
            new_bias = torch.cat([self.final_logits_bias, extra_bias], dim=1)
        self.register_buffer("final_logits_bias", new_bias)

--- a/tests/test_modeling_bart.py
+++ b/tests/test_modeling_bart.py
@@ -690,4 +690,8 @@ class TestSinusoidalPositionalEmbeddings(unittest.TestCase):
        # test that forward pass is just a lookup, there is no ignore padding logic
        input_ids = torch.tensor([[4, 10, pad, pad, pad]], dtype=torch.long, device=torch_device)
        no_cache_pad_zero = emb1(input_ids)
-        self.assertTrue(torch.allclose(torch.Tensor(self.desired_weights), no_cache_pad_zero[:3, :5], atol=1e-3))
+        self.assertTrue(
+            torch.allclose(
+                torch.tensor(self.desired_weights, device=torch_device), no_cache_pad_zero[:3, :5], atol=1e-3
+            )
+        )