added more promptsource examples

eb42b01b · lintangsutawika · 1cf51552 · eb42b01b · eb42b01b · eb42b01b
Commit eb42b01b authored May 23, 2023 by lintangsutawika
20 changed files
--- a/lm_eval/tasks/pile_enron.yaml
+++ b/lm_eval/tasks/pile_enron.yaml
--- a/lm_eval/tasks/super_glue/wsc.fixed/template-00.yaml
+++ b/lm_eval/tasks/super_glue/wsc.fixed/template-00.yaml
 group:
-  - t0-eval
+  - super-glue-promptsource
-task: "does the pronoun refer to"
+task: "GPT-3 Style"
 dataset_path: super_glue
-dataset_name: wsc.fixed
+dataset_name: boolq
 training_split: train
 validation_split: validation
-use_prompt: "promptsource:does the pronoun refer to"
+use_prompt: "promptsource:GPT-3 Style"
 metric_list:
  - metric: exact_match
    aggregation: mean

--- a/lm_eval/tasks/super_glue/boolq/promptsource-01.yaml
+++ b/lm_eval/tasks/super_glue/boolq/promptsource-01.yaml
+include: promptsource-00.yaml
+group:
+  - super-glue-promptsource
+task: "based on the previous passage"
+use_prompt: "promptsource:based on the previous passage"
--- a/lm_eval/tasks/super_glue/boolq/promptsource-02.yaml
+++ b/lm_eval/tasks/super_glue/boolq/promptsource-02.yaml
+include: promptsource-00.yaml
+group:
+  - super-glue-promptsource
+task: "based on the following passage"
+use_prompt: "promptsource:based on the following passage"
--- a/lm_eval/tasks/super_glue/cb/can_we_infer.yaml
+++ b/lm_eval/tasks/super_glue/cb/can_we_infer.yaml
-group:
-  - super-glue-cb
-include: based_on_previous_passage.yaml
-task: can we infer
-reference: Webson & Pavlick 2021
-doc_to_text: "Suppose {{premise}} Can we infer that \"{{hypothesis}}\"? Yes, no, or maybe?"
-doc_to_target: "{% set answer_choices = ['Yes', 'No', 'Maybe'] %}{{answer_choices[label]}}"
--- a/lm_eval/tasks/super_glue/cb/claim_true_false_inconclusive.yaml
+++ b/lm_eval/tasks/super_glue/cb/claim_true_false_inconclusive.yaml
-group:
-  - super-glue-cb
-include: based_on_previous_passage.yaml
-task: claim true/false/inconclusive
-reference: Sanh et al. 2021
-doc_to_text: "{{premise}} Based on that information, is the claim: \"{{hypothesis}}\" \"true\", \"false\", or \"inconclusive\"?"
-doc_to_target: "{% set answer_choices = ['True', 'False', 'Inconclusive'] %}{{answer_choices[label]}}"
--- a/lm_eval/tasks/super_glue/wsc.fixed/template-01.yaml
+++ b/lm_eval/tasks/super_glue/wsc.fixed/template-01.yaml
 group:
-  - t0-eval
+  - super-glue-promptsource
-task: "by p they mean"
+task: "GPT-3 style"
 dataset_path: super_glue
-dataset_name: wsc.fixed
+dataset_name: cb
 training_split: train
 validation_split: validation
-use_prompt: "promptsource:by p they mean"
+use_prompt: "promptsource:GPT-3 style"
 metric_list:
  - metric: exact_match
    aggregation: mean

--- a/lm_eval/tasks/super_glue/cb/promptsource-01.yaml
+++ b/lm_eval/tasks/super_glue/cb/promptsource-01.yaml
+include: promptsource-00.yaml
+group:
+  - super-glue-promptsource
+task: "MNLI crowdsource"
+use_prompt: "promptsource:MNLI crowdsource"
--- a/lm_eval/tasks/super_glue/cb/promptsource-02.yaml
+++ b/lm_eval/tasks/super_glue/cb/promptsource-02.yaml
+include: promptsource-00.yaml
+group:
+  - super-glue-promptsource
+task: "based on the previous passage"
+use_prompt: "promptsource:based on the previous passage"
--- a/lm_eval/tasks/super_glue/cb/based_on_previous_passage.yaml
+++ b/lm_eval/tasks/super_glue/cb/based_on_previous_passage.yaml
 group:
-  - super-glue-cb
+  - super-glue-promptsource
-task: based on the previous passage
+task: "C1 or C2? premise, so/because…"
-reference: "Adapted from the BoolQ prompts in Schick & Sch\xFCtze 2021."
 dataset_path: super_glue
-dataset_name: cb
+dataset_name: copa
 training_split: train
 validation_split: validation
-doc_to_text: "{{premise}} Based on the previous passage, is it true that \"{{hypothesis}}\"? Yes, no, or maybe?"
+use_prompt: "promptsource:C1 or C2? premise, so/because…"
-doc_to_target: "{% set answer_choices = ['Yes', 'No', 'Maybe'] %}{{answer_choices[label]}}"
 metric_list:
  - metric: exact_match
    aggregation: mean

--- a/lm_eval/tasks/super_glue/copa/promptsource-01.yaml
+++ b/lm_eval/tasks/super_glue/copa/promptsource-01.yaml
+include: promptsource-00.yaml
+group:
+  - super-glue-promptsource
+task: "best_option"
+use_prompt: "promptsource:best_option"
--- a/lm_eval/tasks/super_glue/copa/promptsource-02.yaml
+++ b/lm_eval/tasks/super_glue/copa/promptsource-02.yaml
+include: promptsource-00.yaml
+group:
+  - super-glue-promptsource
+task: "cause_effect"
+use_prompt: "promptsource:cause_effect"
--- a/lm_eval/tasks/super_glue/multirc/promptsource-00.yaml
+++ b/lm_eval/tasks/super_glue/multirc/promptsource-00.yaml
+group:
+  - super-glue-promptsource
+task: "I was going to say…"
+dataset_path: super_glue
+dataset_name: multirc
+training_split: train
+validation_split: validation
+use_prompt: "promptsource:I was going to say…"
+metric_list:
+  - metric: exact_match
+    aggregation: mean
+    higher_is_better: true
+    ignore_case: true
+    ignore_punctuation: true
--- a/lm_eval/tasks/super_glue/multirc/promptsource-01.yaml
+++ b/lm_eval/tasks/super_glue/multirc/promptsource-01.yaml
+include: promptsource-00.yaml
+group:
+  - super-glue-promptsource
+task: "Would it be good to answer…"
+use_prompt: "promptsource:Would it be good to answer…"
--- a/lm_eval/tasks/super_glue/multirc/promptsource-02.yaml
+++ b/lm_eval/tasks/super_glue/multirc/promptsource-02.yaml
+include: promptsource-00.yaml
+group:
+  - super-glue-promptsource
+task: "confirm"
+use_prompt: "promptsource:confirm"
--- a/lm_eval/tasks/super_glue/record/promptsource-00.yaml
+++ b/lm_eval/tasks/super_glue/record/promptsource-00.yaml
+group:
+  - super-glue-promptsource
+task: "Add sentence after (continuation choices)"
+dataset_path: super_glue
+dataset_name: record
+training_split: train
+validation_split: validation
+use_prompt: "promptsource:Add sentence after (continuation choices)"
+metric_list:
+  - metric: exact_match
+    aggregation: mean
+    higher_is_better: true
+    ignore_case: true
+    ignore_punctuation: true
--- a/lm_eval/tasks/super_glue/record/promptsource-01.yaml
+++ b/lm_eval/tasks/super_glue/record/promptsource-01.yaml
+include: promptsource-00.yaml
+group:
+  - super-glue-promptsource
+task: "Add sentence after after (continuation choices)"
+use_prompt: "promptsource:Add sentence after after (continuation choices)"
--- a/lm_eval/tasks/super_glue/record/promptsource-02.yaml
+++ b/lm_eval/tasks/super_glue/record/promptsource-02.yaml
+include: promptsource-00.yaml
+group:
+  - super-glue-promptsource
+task: "Can you figure out…"
+use_prompt: "promptsource:Can you figure out…"
--- a/lm_eval/tasks/super_glue/rte/promptsource-00.yaml
+++ b/lm_eval/tasks/super_glue/rte/promptsource-00.yaml
+group:
+  - super-glue-promptsource
+task: "GPT-3 style"
+dataset_path: super_glue
+dataset_name: rte
+training_split: train
+validation_split: validation
+use_prompt: "promptsource:GPT-3 style"
+metric_list:
+  - metric: exact_match
+    aggregation: mean
+    higher_is_better: true
+    ignore_case: true
+    ignore_punctuation: true
--- a/lm_eval/tasks/super_glue/rte/promptsource-01.yaml
+++ b/lm_eval/tasks/super_glue/rte/promptsource-01.yaml
+include: promptsource-00.yaml
+group:
+  - super-glue-promptsource
+task: "MNLI crowdsource"
+use_prompt: "promptsource:MNLI crowdsource"