correct conversion (#11394)

2dc2d79a · Patrick von Platen · GitHub · b48cf712 · 2dc2d79a
Unverified Commit 2dc2d79a authored Apr 23, 2021 by Patrick von Platen Committed by GitHub Apr 23, 2021
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

src/transformers/modeling_flax_pytorch_utils.py src/transformers/modeling_flax_pytorch_utils.py +1 -1

No files found.
--- a/src/transformers/modeling_flax_pytorch_utils.py
+++ b/src/transformers/modeling_flax_pytorch_utils.py
@@ -86,7 +86,7 @@ def convert_pytorch_state_dict_to_flax(pt_state_dict, flax_model):
            pt_tuple_key = (flax_model.base_model_prefix,) + pt_tuple_key
        # Correctly rename weight parameters
-        if pt_tuple_key[-1] == "weight" and pt_tuple_key[:-1] + ("scale",) in random_flax_state_dict:
+        if pt_tuple_key[-1] in ["weight", "gamma"] and pt_tuple_key[:-1] + ("scale",) in random_flax_state_dict:
            pt_tuple_key = pt_tuple_key[:-1] + ("scale",)
        if pt_tuple_key[-1] == "weight" and pt_tuple_key[:-1] + ("embedding",) in random_flax_state_dict:
            pt_tuple_key = pt_tuple_key[:-1] + ("embedding",)