config.architectures

b85c59f9 · Julien Chaumond · Lysandre Debut · f9bc3f57 · b85c59f9 · b85c59f9
Commit b85c59f9 authored Jan 30, 2020 by Julien Chaumond Committed by Lysandre Debut Jan 30, 2020
Show whitespace changes
Inline Side-by-side

Showing with 4 additions and 0 deletions

src/transformers/configuration_utils.py src/transformers/configuration_utils.py +1 -0

src/transformers/modeling_utils.py src/transformers/modeling_utils.py +3 -0

No files found.
--- a/src/transformers/configuration_utils.py
+++ b/src/transformers/configuration_utils.py
@@ -82,6 +82,7 @@ class PretrainedConfig(object):
        self.num_return_sequences = kwargs.pop("num_return_sequences", 1)

        # Fine-tuning task arguments
+        self.architectures = kwargs.pop("architectures", None)
        self.finetuning_task = kwargs.pop("finetuning_task", None)
        self.num_labels = kwargs.pop("num_labels", 2)
        self.id2label = kwargs.pop("id2label", {i: "LABEL_{}".format(i) for i in range(self.num_labels)})

--- a/src/transformers/modeling_utils.py
+++ b/src/transformers/modeling_utils.py
@@ -284,6 +284,9 @@ class PreTrainedModel(nn.Module, ModuleUtilsMixin):
        # Only save the model itself if we are using distributed training
        model_to_save = self.module if hasattr(self, "module") else self

+        # Attach architecture to the config
+        model_to_save.config.architectures = [model_to_save.__class__.__name__]
+
        # Save configuration file
        model_to_save.config.save_pretrained(save_directory)