Update gem_mlsum

9abb1814 · Shashi456 · 7e25c240 · 9abb1814 · 9abb1814
Commit 9abb1814 authored Apr 28, 2022 by Shashi456
Hide whitespace changes
Inline Side-by-side

Showing with 44 additions and 9 deletions

lm_eval/tasks/__init__.py lm_eval/tasks/__init__.py +12 -3

lm_eval/tasks/gem_mlsum.py lm_eval/tasks/gem_mlsum.py +32 -6

No files found.
--- a/lm_eval/tasks/__init__.py
+++ b/lm_eval/tasks/__init__.py
@@ -53,9 +53,10 @@ from . import asdiv
 from . import gsm8k
 from . import storycloze
 from . import hans
-from . import mlsum
 from . import gem_webnlg
+from . import gem_mlsum
 # from . import e2e_nlg_cleaned
 ########################################
@@ -288,8 +289,16 @@ TASK_REGISTRY = {
    "blimp_wh_vs_that_no_gap_long_distance": blimp.BlimpWhVsThatNoGapLongDistance,
    "blimp_wh_vs_that_with_gap": blimp.BlimpWhVsThatWithGap,
    "blimp_wh_vs_that_with_gap_long_distance": blimp.BlimpWhVsThatWithGapLongDistance,
-    "mlsum_es":mlsum.MLSUMEs,
-    "mlsum_de":mlsum.MLSUMDe,
+    #GEM/mlsum
+    "mlsum_es":gem_mlsum.MLSUMEs,
+    "mlsum_de":gem_mlsum.MLSUMDe,
+    "mlsum_es_covid_challenge_set":gem_mlsum.GEMMLSUMEsChallgeTestCovid,
+    "mlsum_de_covid_challenge_set":gem_mlsum.GEMMLSUMDeChallgeTestCovid,
    # Requires manual download of data.
    # "storycloze_2016": storycloze.StoryCloze2016,
    # "storycloze_2018": storycloze.StoryCloze2018,

--- a/lm_eval/tasks/mlsum.py
+++ b/lm_eval/tasks/mlsum.py
@@ -22,7 +22,7 @@ _CITATION = """
 """
-class MLSUMEs(PromptSourceTask):
+class GEMMLSUMEsBase(PromptSourceTask):
    VERSION = 0
    DATASET_PATH = "GEM/mlsum"
    DATASET_NAME = "es"
@@ -53,12 +53,24 @@ class MLSUMEs(PromptSourceTask):
    def stopping_criteria(self):
        return "."
-    def max_generation_length(self):
+class GEMMLSUMEs(GEMMLSUMEsBase):
-        return 120
+    '''this is for train/validation/test'''
+    SPLIT = ''
+class GEMMLSUMEsChallgeTestCovid(GEMMLSUMEsBase):
+     '''this is for challenge_test_covid'''
+     SPLIT = 'challenge_test_covid'
+     def has_training_docs(self):
+         return False
-class MLSUMDe(PromptSourceTask):
+     def has_validation_docs(self):
+         return False
+     def test_docs(self):
+         if self.has_test_docs():
+             return self.dataset[self.SPLIT] 
+class GEMMLSUMDeBase(PromptSourceTask):
    VERSION = 0
    DATASET_PATH = "GEM/mlsum"
    DATASET_NAME = "de"
@@ -89,5 +101,19 @@ class MLSUMDe(PromptSourceTask):
    def stopping_criteria(self):
        return "."
-    def max_generation_length(self):
+class GEMMLSUMDe(GEMMLSUMDeBase):
-        return 120
+    '''this is for train/validation/test'''
+    SPLIT = ''
+class GEMMLSUMDeChallgeTestCovid(GEMMLSUMDeBase):
+     '''this is for challenge_test_covid'''
+     SPLIT = 'challenge_test_covid'
+     def has_training_docs(self):
+         return False
+     def has_validation_docs(self):
+         return False
+     def test_docs(self):
+         if self.has_test_docs():
+             return self.dataset[self.SPLIT]