Rename embedding layers to be the same as NMT (#628)

Summary: Pull Request resolved: https://github.com/pytorch/fairseq/pull/628 Updating embedding layers in TransformerSentenceEncoder to be compatible with the transformer model. Reviewed By: liezl200 Differential Revision: D14836883 fbshipit-source-id: 2240f61bf40b191d01b4efdaac4dd7562b4166c6

Rename embedding layers to be the same as NMT (#628)
Summary: Pull Request resolved: https://github.com/pytorch/fairseq/pull/628 Updating embedding layers in TransformerSentenceEncoder to be compatible with the transformer model. Reviewed By: liezl200 Differential Revision: D14836883 fbshipit-source-id: 2240f61bf40b191d01b4efdaac4dd7562b4166c6
c2820af0 · Kartikay Khandelwal · Facebook Github Bot · 94e9d77c · c2820af0 · c2820af0
Commit c2820af0 authored Apr 09, 2019 by Kartikay Khandelwal Committed by Facebook Github Bot Apr 09, 2019
Showing with 7 additions and 7 deletions

fairseq/modules/transformer_sentence_encoder.py fairseq/modules/transformer_sentence_encoder.py +5 -5

fairseq/modules/transformer_sentence_encoder_layer.py fairseq/modules/transformer_sentence_encoder_layer.py +2 -2

No files found.
--- a/fairseq/modules/transformer_sentence_encoder.py
+++ b/fairseq/modules/transformer_sentence_encoder.py
@@ -106,7 +106,7 @@ class TransformerSentenceEncoder(nn.Module):
        self.use_position_embeddings = use_position_embeddings
        self.apply_bert_init = apply_bert_init
-        self.token_embeddings = nn.Embedding(
+        self.embed_tokens = nn.Embedding(
            self.vocab_size, self.embedding_dim, self.padding_idx
        )
@@ -116,7 +116,7 @@ class TransformerSentenceEncoder(nn.Module):
            else None
        )
-        self.position_embeddings = (
+        self.embed_positions = (
            PositionalEmbedding(
                self.max_seq_len,
                self.embedding_dim,
@@ -161,8 +161,8 @@ class TransformerSentenceEncoder(nn.Module):
        # embed positions
        positions = (
-            self.position_embeddings(tokens)
+            self.embed_positions(tokens)
-            if self.position_embeddings is not None else None
+            if self.embed_positions is not None else None
        )
        # embed segments
@@ -172,7 +172,7 @@ class TransformerSentenceEncoder(nn.Module):
            else None
        )
-        x = self.token_embeddings(tokens)
+        x = self.embed_tokens(tokens)
        if positions is not None:
            x += positions
        if segments is not None:

--- a/fairseq/modules/transformer_sentence_encoder_layer.py
+++ b/fairseq/modules/transformer_sentence_encoder_layer.py
@@ -51,7 +51,7 @@ class TransformerSentenceEncoderLayer(nn.Module):
        # Initialize blocks
        self.activation_fn = gelu if use_gelu else F.relu
-        self.self_attention = MultiheadAttention(
+        self.self_attn = MultiheadAttention(
            self.embedding_dim, num_attention_heads, dropout=attention_dropout
        )
@@ -97,7 +97,7 @@ class TransformerSentenceEncoderLayer(nn.Module):
        residual = x
        x = self._maybe_layer_norm(self.self_attn_layer_norm, x, before=True)
-        x, attn = self.self_attention(
+        x, attn = self.self_attn(
            query=x,
            key=x,
            value=x,