[FLAX] Add dtype to embedding for gpt2 model (#18462)

* [FLAX] Add dtype to embedding for gpt2 model * lint

[FLAX] Add dtype to embedding for gpt2 model (#18462)
* [FLAX] Add dtype to embedding for gpt2 model * lint
c186e816 · Lianmin Zheng · GitHub · baa00f65 · c186e816
Unverified Commit c186e816 authored Oct 20, 2022 by Lianmin Zheng Committed by GitHub Oct 20, 2022
Show whitespace changes
Inline Side-by-side

Showing with 2 additions and 0 deletions

src/transformers/models/gpt2/modeling_flax_gpt2.py src/transformers/models/gpt2/modeling_flax_gpt2.py +2 -0

No files found.
--- a/src/transformers/models/gpt2/modeling_flax_gpt2.py
+++ b/src/transformers/models/gpt2/modeling_flax_gpt2.py
@@ -597,11 +597,13 @@ class FlaxGPT2Module(nn.Module):
            self.config.vocab_size,
            self.embed_dim,
            embedding_init=jax.nn.initializers.normal(stddev=self.config.initializer_range),
+            dtype=self.dtype,
        )
        self.wpe = nn.Embed(
            self.config.max_position_embeddings,
            self.embed_dim,
            embedding_init=jax.nn.initializers.normal(stddev=self.config.initializer_range),
+            dtype=self.dtype,
        )
        self.dropout = nn.Dropout(rate=self.config.embd_pdrop)
        self.h = FlaxGPT2BlockCollection(self.config, dtype=self.dtype)