Allow users to specify en headqa or es

5855f482 · thomasw21 · 134150a2 · 5855f482 · 5855f482 · 5855f482
Commit 5855f482 authored Dec 23, 2021 by thomasw21
Show whitespace changes
Inline Side-by-side

Showing with 11 additions and 4 deletions

README.md README.md +2 -1

lm_eval/tasks/__init__.py lm_eval/tasks/__init__.py +2 -1

lm_eval/tasks/headqa.py lm_eval/tasks/headqa.py +7 -2

No files found.
--- a/README.md
+++ b/README.md
@@ -128,7 +128,8 @@ To implement a new task in eval harness, see [this guide](https://github.com/Ele
 |openbookqa                                       |✓    |✓  |✓   |          500|acc, acc_norm                                                                 |
 |squad2                                           |✓    |✓  |    |        11873|exact, f1, HasAns_exact, HasAns_f1, NoAns_exact, NoAns_f1, best_exact, best_f1|
 |race                                             |✓    |✓  |✓   |         1045|acc                                                                           |
-|headqa                                           |✓    |✓  |✓   |         2742|acc, acc_norm                                                                 |
+|headqa_es                                        |✓    |✓  |✓   |         2742|acc, acc_norm                                                                 |
+|headqa_en                                        |✓    |✓  |✓   |         2742|acc, acc_norm                                                                 |
 |mathqa                                           |✓    |✓  |✓   |         2985|acc, acc_norm                                                                 |
 |webqs                                            |✓    |   |✓   |         2032|acc                                                                           |
 |wsc273                                           |     |   |✓   |          273|acc                                                                           |

--- a/lm_eval/tasks/__init__.py
+++ b/lm_eval/tasks/__init__.py
@@ -132,7 +132,8 @@ TASK_REGISTRY = {
    "squad2": squad.SQuAD2,
    "race": race.RACE,
    # "naturalqs": naturalqs.NaturalQs, # not implemented yet
-    "headqa": headqa.HeadQA,
+    "headqa_es": headqa.HeadQAEs,
+    "headqa_en": headqa.HeadQAEn,
    "mathqa": mathqa.MathQA,
    "webqs": webqs.WebQs,
    "wsc273": wsc273.WinogradSchemaChallenge273,

--- a/lm_eval/tasks/headqa.py
+++ b/lm_eval/tasks/headqa.py
@@ -2,10 +2,9 @@ from . common import HFTask
 from lm_eval.base import MultipleChoiceTask
-class HeadQA(HFTask, MultipleChoiceTask):
+class HeadQABase(HFTask, MultipleChoiceTask):
    VERSION = 0
    DATASET_PATH = "head_qa"
-    DATASET_NAME = None
    def has_training_docs(self):
        return True
@@ -31,3 +30,9 @@ class HeadQA(HFTask, MultipleChoiceTask):
    def doc_to_text(self, doc):
        return doc["query"]
+class HeadQAEn(HeadQABase):
+    DATASET_NAME = "en"
+class HeadQAEs(HeadQABase):
+    DATASET_NAME = "es"
\ No newline at end of file