Merge pull request #770 from tju01/big-refactor

[Refactor] Use evaluation mode for accelerate to prevent OOM

Merge pull request #770 from tju01/big-refactor
[Refactor] Use evaluation mode for accelerate to prevent OOM
c2f76ec7 · Hailey Schoelkopf · GitHub · 7634a6ec · d69a962d · c2f76ec7
Unverified Commit c2f76ec7 authored Aug 11, 2023 by Hailey Schoelkopf Committed by GitHub Aug 11, 2023
Show whitespace changes
Inline Side-by-side

Showing with 3 additions and 1 deletion

lm_eval/models/huggingface.py lm_eval/models/huggingface.py +3 -1

No files found.
--- a/lm_eval/models/huggingface.py
+++ b/lm_eval/models/huggingface.py
@@ -289,7 +289,9 @@ class HFLM(LM):
                        "Failed to place model onto specified device. This may be because the model is quantized via `bitsandbytes`. If the desired GPU is being used, this message is safe to ignore."
                    )
            else:
-                self._model = accelerator.prepare(self.model)
+                self._model = accelerator.prepare_model(
+                    self.model, evaluation_mode=True
+                )
                self._device = torch.device(f"cuda:{accelerator.local_process_index}")
                self.accelerator = accelerator