fix alllll the merge conflicts

7d09b24c · haileyschoelkopf · 96dfe976 · 6348b947 · 7d09b24c · 7d09b24c
Commit 7d09b24c authored Jul 03, 2024 by haileyschoelkopf
20 changed files
--- a/lm_eval/tasks/kormedmcqa/_kormedmcqa.yaml
+++ b/lm_eval/tasks/kormedmcqa/_kormedmcqa.yaml
+group: kormedmcqa
+task:
+  - kormedmcqa_doctor
+  - kormedmcqa_nurse
+  - kormedmcqa_pharm
+aggregate_metric_list:
+  - metric: exact_match
+    aggregation: mean
+    weight_by_size: true
+metadata:
+  version: 0.0
--- a/lm_eval/tasks/kormedmcqa/kormedmcqa_doctor.yaml
+++ b/lm_eval/tasks/kormedmcqa/kormedmcqa_doctor.yaml
-group: kormedmcqa
 task : kormedmcqa_doctor
 dataset_path : sean0042/KorMedMCQA
 dataset_name : doctor

--- a/lm_eval/tasks/kormedmcqa/kormedmcqa_nurse.yaml
+++ b/lm_eval/tasks/kormedmcqa/kormedmcqa_nurse.yaml
-group: kormedmcqa
 task : kormedmcqa_nurse
 dataset_path : sean0042/KorMedMCQA
 dataset_name : nurse

--- a/lm_eval/tasks/kormedmcqa/kormedmcqa_pharm.yaml
+++ b/lm_eval/tasks/kormedmcqa/kormedmcqa_pharm.yaml
-group: kormedmcqa
 task : kormedmcqa_pharm
 dataset_path : sean0042/KorMedMCQA
 dataset_name : pharm

--- a/lm_eval/tasks/lambada/lambada_openai.yaml
+++ b/lm_eval/tasks/lambada/lambada_openai.yaml
-group:
+tag:
  - lambada
 task: lambada_openai
 dataset_path: EleutherAI/lambada_openai

--- a/lm_eval/tasks/lambada/lambada_standard.yaml
+++ b/lm_eval/tasks/lambada/lambada_standard.yaml
-group:
+tag:
  - lambada
 task: lambada_standard
 dataset_path: lambada

--- a/lm_eval/tasks/lambada_cloze/lambada_openai_cloze.yaml
+++ b/lm_eval/tasks/lambada_cloze/lambada_openai_cloze.yaml
-group:
+tag:
  - lambada_cloze
 task: lambada_openai_cloze_yaml
 dataset_path: EleutherAI/lambada_openai

--- a/lm_eval/tasks/lambada_cloze/lambada_standard_cloze.yaml
+++ b/lm_eval/tasks/lambada_cloze/lambada_standard_cloze.yaml
-group:
+tag:
  - lambada_cloze
 task: lambada_standard_cloze_yaml
 dataset_path: lambada

--- a/lm_eval/tasks/lambada_multilingual/lambada_mt_en.yaml
+++ b/lm_eval/tasks/lambada_multilingual/lambada_mt_en.yaml
-group:
+tag:
  - lambada_multilingual
 task: lambada_openai_mt_en
 dataset_path: EleutherAI/lambada_openai

--- a/lm_eval/tasks/mathqa/mathqa.yaml
+++ b/lm_eval/tasks/mathqa/mathqa.yaml
-group:
+tag:
  - math_word_problems
 task: mathqa
 dataset_path: math_qa

--- a/lm_eval/tasks/mmlu/_generate_configs.py
+++ b/lm_eval/tasks/mmlu/_generate_configs.py
@@ -110,10 +110,9 @@ if __name__ == "__main__":

        yaml_dict = {
            "include": base_yaml_name,
-            "group": f"mmlu_{args.task_prefix}_{category}"
+            "tag": f"mmlu_{args.task_prefix}_{category}"
            if args.task_prefix != ""
            else f"mmlu_{category}",
-            "group_alias": category.replace("_", " "),
            "task": f"mmlu_{args.task_prefix}_{subject}"
            if args.task_prefix != ""
            else f"mmlu_{subject}",

--- a/lm_eval/tasks/mmlu/continuation/_mmlu.yaml
+++ b/lm_eval/tasks/mmlu/continuation/_mmlu.yaml
@@ -4,28 +4,28 @@ task:
  - group: stem
    task:
      - mmlu_continuation_stem
-    aggregate_metric:
+    aggregate_metric_list:
      - metric: acc
        weight_by_size: True
  - group: other
    task:
      - mmlu_continuation_other
-    aggregate_metric:
+    aggregate_metric_list:
      - metric: acc
        weight_by_size: True
  - group: social sciences
    task:
      - mmlu_continuation_social_sciences
-    aggregate_metric:
+    aggregate_metric_list:
      - metric: acc
        weight_by_size: True
  - group: humanities
    task:
      - mmlu_continuation_humanities
-    aggregate_metric:
+    aggregate_metric_list:
      - metric: acc
        weight_by_size: True
-aggregate_metric:
+aggregate_metric_list:
  - metric: acc
    weight_by_size: True
 metadata:

--- a/lm_eval/tasks/mmlu/continuation/mmlu_abstract_algebra.yaml
+++ b/lm_eval/tasks/mmlu/continuation/mmlu_abstract_algebra.yaml
 "dataset_name": "abstract_algebra"
 "description": "The following are questions (with answers) about abstract\
  \ algebra.\n\n"
-"group": "mmlu_continuation_stem"
+"tag": "mmlu_continuation_stem"
 "include": "_continuation_template_yaml"
 "task": "mmlu_continuation_abstract_algebra"
--- a/lm_eval/tasks/mmlu/continuation/mmlu_anatomy.yaml
+++ b/lm_eval/tasks/mmlu/continuation/mmlu_anatomy.yaml
 "dataset_name": "anatomy"
 "description": "The following are questions (with answers) about anatomy.\n\
  \n"
-"group": "mmlu_continuation_stem"
+"tag": "mmlu_continuation_stem"
 "include": "_continuation_template_yaml"
 "task": "mmlu_continuation_anatomy"
--- a/lm_eval/tasks/mmlu/continuation/mmlu_astronomy.yaml
+++ b/lm_eval/tasks/mmlu/continuation/mmlu_astronomy.yaml
 "dataset_name": "astronomy"
 "description": "The following are questions (with answers) about astronomy.\n\
  \n"
-"group": "mmlu_continuation_stem"
+"tag": "mmlu_continuation_stem"
 "include": "_continuation_template_yaml"
 "task": "mmlu_continuation_astronomy"
--- a/lm_eval/tasks/mmlu/continuation/mmlu_business_ethics.yaml
+++ b/lm_eval/tasks/mmlu/continuation/mmlu_business_ethics.yaml
 "dataset_name": "business_ethics"
 "description": "The following are questions (with answers) about business\
  \ ethics.\n\n"
-"group": "mmlu_continuation_other"
+"tag": "mmlu_continuation_other"
 "include": "_continuation_template_yaml"
 "task": "mmlu_continuation_business_ethics"
--- a/lm_eval/tasks/mmlu/continuation/mmlu_clinical_knowledge.yaml
+++ b/lm_eval/tasks/mmlu/continuation/mmlu_clinical_knowledge.yaml
 "dataset_name": "clinical_knowledge"
 "description": "The following are questions (with answers) about clinical\
  \ knowledge.\n\n"
-"group": "mmlu_continuation_other"
+"tag": "mmlu_continuation_other"
 "include": "_continuation_template_yaml"
 "task": "mmlu_continuation_clinical_knowledge"
--- a/lm_eval/tasks/mmlu/continuation/mmlu_college_biology.yaml
+++ b/lm_eval/tasks/mmlu/continuation/mmlu_college_biology.yaml
 "dataset_name": "college_biology"
 "description": "The following are questions (with answers) about college\
  \ biology.\n\n"
-"group": "mmlu_continuation_stem"
+"tag": "mmlu_continuation_stem"
 "include": "_continuation_template_yaml"
 "task": "mmlu_continuation_college_biology"
--- a/lm_eval/tasks/mmlu/continuation/mmlu_college_chemistry.yaml
+++ b/lm_eval/tasks/mmlu/continuation/mmlu_college_chemistry.yaml
 "dataset_name": "college_chemistry"
 "description": "The following are questions (with answers) about college\
  \ chemistry.\n\n"
-"group": "mmlu_continuation_stem"
+"tag": "mmlu_continuation_stem"
 "include": "_continuation_template_yaml"
 "task": "mmlu_continuation_college_chemistry"
--- a/lm_eval/tasks/mmlu/continuation/mmlu_college_computer_science.yaml
+++ b/lm_eval/tasks/mmlu/continuation/mmlu_college_computer_science.yaml
 "dataset_name": "college_computer_science"
 "description": "The following are questions (with answers) about college\
  \ computer science.\n\n"
-"group": "mmlu_continuation_stem"
+"tag": "mmlu_continuation_stem"
 "include": "_continuation_template_yaml"
 "task": "mmlu_continuation_college_computer_science"