fixed output_proj's input_dim in attention (#226)

7358296b · higgsfield · Myle Ott · 28adb200 · 7358296b
Commit 7358296b authored Jul 25, 2018 by higgsfield Committed by Myle Ott Jul 25, 2018
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

fairseq/models/lstm.py fairseq/models/lstm.py +1 -1

No files found.
--- a/fairseq/models/lstm.py
+++ b/fairseq/models/lstm.py
@@ -217,7 +217,7 @@ class AttentionLayer(nn.Module):
        super().__init__()
        self.input_proj = Linear(input_embed_dim, output_embed_dim, bias=False)
-        self.output_proj = Linear(2*output_embed_dim, output_embed_dim, bias=False)
+        self.output_proj = Linear(input_embed_dim + output_embed_dim, output_embed_dim, bias=False)
    def forward(self, input, source_hids, encoder_padding_mask):
        # input: bsz x input_embed_dim