QNLI with PS integration.

b44aa554 · cjlovering · 4c201b97 · b44aa554
Commit b44aa554 authored Apr 25, 2022 by cjlovering
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 22 deletions

lm_eval/tasks/glue.py lm_eval/tasks/glue.py +1 -22

No files found.
--- a/lm_eval/tasks/glue.py
+++ b/lm_eval/tasks/glue.py
@@ -146,7 +146,7 @@ class MNLIMismatched(MNLI):
            return self.dataset["test_mismatched"]
-class QNLI(Task):
+class QNLI(PromptSourceTask):
    VERSION = 0
    DATASET_PATH = "glue"
    DATASET_NAME = "qnli"
@@ -168,18 +168,6 @@ class QNLI(Task):
    def validation_docs(self):
        return self.dataset["validation"]
-    def process_results(self, doc, results):
-        ll_yes, ll_no = results
-        pred = ll_no > ll_yes
-        gold = doc["label"]
-        return {"acc": pred == gold}
-    def higher_is_better(self):
-        return {"acc": True}
-    def aggregation(self):
-        return {"acc": mean}
 class WNLI(PromptSourceTask):
    VERSION = 1
@@ -196,20 +184,11 @@ class WNLI(PromptSourceTask):
        return False
    def training_docs(self):
-        # if self._training_docs is None:
-        #     self._training_docs = list()
-        # return self._training_docs
        return self.dataset["train"]
    def validation_docs(self):
        return self.dataset["validation"]
-    def higher_is_better(self):
-        return {"acc": True}
-    def aggregation(self):
-        return {"acc": mean}
 class RTE(PromptSourceTask):
    VERSION = 0