made _load_pretrained_model_low_mem static + bug fix (#16548)

8bf6d28c · Francesco Saverio Zuppichini · GitHub · 02214cb3 · 8bf6d28c
Unverified Commit 8bf6d28c authored Apr 05, 2022 by Francesco Saverio Zuppichini Committed by GitHub Apr 05, 2022
Hide whitespace changes
Inline Side-by-side

Showing with 3 additions and 3 deletions

src/transformers/modeling_utils.py src/transformers/modeling_utils.py +3 -3

No files found.
--- a/src/transformers/modeling_utils.py
+++ b/src/transformers/modeling_utils.py
@@ -2103,8 +2103,8 @@ class PreTrainedModel(nn.Module, ModuleUtilsMixin, GenerationMixin, PushToHubMix

        return retrieved_modules

-    @classmethod
-    def _load_pretrained_model_low_mem(cls, model, loaded_state_dict_keys, resolved_archive_file):
+    @staticmethod
+    def _load_pretrained_model_low_mem(model, loaded_state_dict_keys, resolved_archive_file):
        """
        This is an experimental function that loads the model using ~1.x model size CPU memory

@@ -2159,7 +2159,7 @@ class PreTrainedModel(nn.Module, ModuleUtilsMixin, GenerationMixin, PushToHubMix
            resolved_archive_file = [resolved_archive_file]

        for archive_file in resolved_archive_file:
-            state_dict = torch.load(resolved_archive_file, map_location="cpu")
+            state_dict = torch.load(archive_file, map_location="cpu")

            # materialize state_dict entries one by one on CPU
            for k in loaded_state_dict_keys: