bugfixes missed from local branch

629bcfba · Benjamin Fattori · 09e91431 · 629bcfba · 629bcfba · 629bcfba
Commit 629bcfba authored May 05, 2023 by Benjamin Fattori
Hide whitespace changes
Inline Side-by-side

Showing with 15 additions and 13 deletions

lm_eval/evaluator.py lm_eval/evaluator.py +1 -1

lm_eval/models/gpt2.py lm_eval/models/gpt2.py +3 -0

main.py main.py +11 -12

No files found.
--- a/lm_eval/evaluator.py
+++ b/lm_eval/evaluator.py
@@ -200,7 +200,7 @@ def evaluate(
        # calculate values for each filter setup (TODO: make getting list of keys cleaner)
        # TODO: make it possible to use a different metric per key
        for key in task.instances[0].filtered_resps.keys():
-            for doc_id, doc in enumerate(itertools.islice(task.test_docs(), 0, limit) if task.has_test_docs() else task.validation_docs()):
+            for doc_id, doc in itertools.islice(enumerate(task.test_docs()), lm.rank, None, lm.world_size) if task.has_test_docs() else itertools.islice(enumerate(task.validation_docs()), lm.rank, None, lm.world_size):
                # subset instances to only this document id ; sort by idx
                requests = list(filter(lambda x: x.doc_id == doc_id, task.instances))
                requests.sort(key=lambda x: x.idx)

--- a/lm_eval/models/gpt2.py
+++ b/lm_eval/models/gpt2.py
@@ -45,6 +45,9 @@ class HFLM(LM):
                    else torch.device("cpu")
                )

+        else:
+            self._device = 'cpu'
+
        # TODO: update this to be less of a hack once subfolder is fixed in HF
        revision = revision + ("/" + subfolder if subfolder is not None else "")


--- a/main.py
+++ b/main.py
@@ -89,19 +89,18 @@ def main():

    print(f"Selected Tasks: {task_names}")

+    results = evaluator.simple_evaluate(
+        model=args.model,
+        model_args=args.model_args,
+        tasks=task_names,
+        num_fewshot=args.num_fewshot,
+        batch_size=args.batch_size,
+        device=args.device,
+        limit=args.limit,
+        decontamination_ngrams_path=args.decontamination_ngrams_path,
+        check_integrity=args.check_integrity,
+    )
    if results is not None:
-        results = evaluator.simple_evaluate(
-            model=args.model,
-            model_args=args.model_args,
-            tasks=task_names,
-            num_fewshot=args.num_fewshot,
-            batch_size=args.batch_size,
-            device=args.device,
-            limit=args.limit,
-            decontamination_ngrams_path=args.decontamination_ngrams_path,
-            check_integrity=args.check_integrity,
-        )
-
        dumped = json.dumps(results, indent=2)
        print(dumped)