triviaqa OOM fix

52f270dc · Leo Gao · e4766cd7 · 52f270dc · 52f270dc
Commit 52f270dc authored Aug 27, 2021 by Leo Gao
Show whitespace changes
Inline Side-by-side

Showing with 5 additions and 2 deletions

lm_eval/tasks/triviaqa.py lm_eval/tasks/triviaqa.py +3 -2

tests/test_tasks.py tests/test_tasks.py +2 -0

No files found.
--- a/lm_eval/tasks/triviaqa.py
+++ b/lm_eval/tasks/triviaqa.py
 import os
 import json
+import jsonlines
 from lm_eval.base import Task, rf
 from ..metrics import mean
 from ..utils import sh
@@ -27,10 +28,10 @@ class TriviaQA(Task):
        return False
    def training_docs(self):
-        return map(json.loads, open('data/triviaqa/unfiltered-web-train.jsonl'))
+        return jsonlines.open('data/triviaqa/unfiltered-web-train.jsonl')
    def validation_docs(self):
-        return map(json.loads, open('data/triviaqa/unfiltered-web-dev.jsonl'))
+        return jsonlines.open('data/triviaqa/unfiltered-web-dev.jsonl')
    def test_docs(self):
        raise NotImplementedError()

--- a/tests/test_tasks.py
+++ b/tests/test_tasks.py
@@ -30,6 +30,8 @@ def test_basic_interface(taskname, Task):
    task2 = Task()
    limit = None
+    if taskname in ["triviaqa"]: limit = 10000
    if task.has_validation_docs():
        arr = list(islice(task.validation_docs(), limit))
        arr2 = list(islice(task2.validation_docs(), limit))