🚨 FLAVA: Remove double softmax (#31322)

Remove double softmax

🚨 FLAVA: Remove double softmax (#31322)
Remove double softmax
a4e1a1d0 · amyeroberts · GitHub · 8fff07de · a4e1a1d0 · a4e1a1d0
Unverified Commit a4e1a1d0 authored Jun 10, 2024 by amyeroberts Committed by GitHub Jun 10, 2024
Showing with 1 addition and 3 deletions

src/transformers/models/flava/modeling_flava.py src/transformers/models/flava/modeling_flava.py +0 -2

tests/models/flava/test_modeling_flava.py tests/models/flava/test_modeling_flava.py +1 -1

No files found.
--- a/src/transformers/models/flava/modeling_flava.py
+++ b/src/transformers/models/flava/modeling_flava.py
@@ -472,8 +472,6 @@ class FlavaSelfAttention(nn.Module):

        # Normalize the attention scores to probabilities.
        attention_probs = nn.functional.softmax(attention_scores, dim=-1)
-        # Normalize the attention scores to probabilities.
-        attention_probs = nn.functional.softmax(attention_scores, dim=-1)

        # This is actually dropping out entire tokens to attend to, which might
        # seem a bit unusual, but is taken from the original Transformer paper.

--- a/tests/models/flava/test_modeling_flava.py
+++ b/tests/models/flava/test_modeling_flava.py
@@ -1285,7 +1285,7 @@ class FlavaModelIntegrationTest(unittest.TestCase):
        # verify the embeddings
        self.assertAlmostEqual(outputs.image_embeddings.sum().item(), -1352.53540, places=4)
        self.assertAlmostEqual(outputs.text_embeddings.sum().item(), -198.98225, places=4)
-        self.assertAlmostEqual(outputs.multimodal_embeddings.sum().item(), -4030.4602050, places=4)
+        self.assertAlmostEqual(outputs.multimodal_embeddings.sum().item(), -4030.4604492, places=4)


 @require_vision