update the mem-transformer example

fb3e3c29 · Rick Ho · b3380ec2 · fb3e3c29
Commit fb3e3c29 authored Feb 07, 2021 by Rick Ho
Hide whitespace changes
Inline Side-by-side

Showing with 5 additions and 2 deletions

examples/transformer-xl/mem_transformer.py examples/transformer-xl/mem_transformer.py +5 -2

No files found.
--- a/examples/transformer-xl/mem_transformer.py
+++ b/examples/transformer-xl/mem_transformer.py
@@ -825,10 +825,13 @@ class CustomizedMoEPositionwiseFF(FMoETransformerMLP):
        super().__init__(num_expert=8, d_model=d_model, d_hidden=d_inner,
                pre_lnorm=pre_lnorm, activation=activation)
        self.dropout = nn.Dropout(dropout)
+        self.bias = nn.Parameter(
+            torch.zeros(d_model, dtype=torch.float32)
+        )
    def forward(self, x):
-        x, bias = super().forward(x)
+        x = super().forward(x)
-        return x + bias
+        return x + self.bias
 class DecoderLayer(nn.Module):