Add MMLU-ProX task (#2811)

* update mmlu_prox configs * update tasks/README * correct hyphon to underline in task/README * update pre-commit codes

Add MMLU-ProX task (#2811)
* update mmlu_prox configs * update tasks/README * correct hyphon to underline in task/README * update pre-commit codes
8aeff141 · heli-qi · GitHub · 8028a42f · 8aeff141 · 8aeff141
Unverified Commit 8aeff141 authored Mar 21, 2025 by heli-qi Committed by GitHub Mar 21, 2025
7 changed files
--- a/lm_eval/tasks/mmlu_prox/zh/mmlu_prox_zh_law.yaml
+++ b/lm_eval/tasks/mmlu_prox/zh/mmlu_prox_zh_law.yaml
+description: '以下是关于法律的选择题（带有答案）。请逐步思考，然后以"答案是 (X)"结束您的回答，其中X是正确的选项字母。
+
+  '
+include: _zh_template_yaml
+task: mmlu_prox_zh_law
+task_alias: law
+process_docs: !function utils.process_law
--- a/lm_eval/tasks/mmlu_prox/zh/mmlu_prox_zh_math.yaml
+++ b/lm_eval/tasks/mmlu_prox/zh/mmlu_prox_zh_math.yaml
+description: '以下是关于数学的选择题（带有答案）。请逐步思考，然后以"答案是 (X)"结束您的回答，其中X是正确的选项字母。
+
+  '
+include: _zh_template_yaml
+task: mmlu_prox_zh_math
+task_alias: math
+process_docs: !function utils.process_math
--- a/lm_eval/tasks/mmlu_prox/zh/mmlu_prox_zh_other.yaml
+++ b/lm_eval/tasks/mmlu_prox/zh/mmlu_prox_zh_other.yaml
+description: '以下是关于其他的选择题（带有答案）。请逐步思考，然后以"答案是 (X)"结束您的回答，其中X是正确的选项字母。
+
+  '
+include: _zh_template_yaml
+task: mmlu_prox_zh_other
+task_alias: other
+process_docs: !function utils.process_other
--- a/lm_eval/tasks/mmlu_prox/zh/mmlu_prox_zh_philosophy.yaml
+++ b/lm_eval/tasks/mmlu_prox/zh/mmlu_prox_zh_philosophy.yaml
+description: '以下是关于哲学的选择题（带有答案）。请逐步思考，然后以"答案是 (X)"结束您的回答，其中X是正确的选项字母。
+
+  '
+include: _zh_template_yaml
+task: mmlu_prox_zh_philosophy
+task_alias: philosophy
+process_docs: !function utils.process_philosophy
--- a/lm_eval/tasks/mmlu_prox/zh/mmlu_prox_zh_physics.yaml
+++ b/lm_eval/tasks/mmlu_prox/zh/mmlu_prox_zh_physics.yaml
+description: '以下是关于物理学的选择题（带有答案）。请逐步思考，然后以"答案是 (X)"结束您的回答，其中X是正确的选项字母。
+
+  '
+include: _zh_template_yaml
+task: mmlu_prox_zh_physics
+task_alias: physics
+process_docs: !function utils.process_physics
--- a/lm_eval/tasks/mmlu_prox/zh/mmlu_prox_zh_psychology.yaml
+++ b/lm_eval/tasks/mmlu_prox/zh/mmlu_prox_zh_psychology.yaml
+description: '以下是关于心理学的选择题（带有答案）。请逐步思考，然后以"答案是 (X)"结束您的回答，其中X是正确的选项字母。
+
+  '
+include: _zh_template_yaml
+task: mmlu_prox_zh_psychology
+task_alias: psychology
+process_docs: !function utils.process_psychology
--- a/lm_eval/tasks/mmlu_prox/zh/utils.py
+++ b/lm_eval/tasks/mmlu_prox/zh/utils.py
+from functools import partial
+from os.path import basename, dirname
+
+from lm_eval.tasks.mmlu_prox.lang_libs import LANG_LIBS
+
+
+lang_abbr = basename(dirname(__file__))
+lang_dict = LANG_LIBS[lang_abbr]
+
+choices = [
+    "A",
+    "B",
+    "C",
+    "D",
+    "E",
+    "F",
+    "G",
+    "H",
+    "I",
+    "J",
+    "K",
+    "L",
+    "M",
+    "N",
+    "O",
+    "P",
+]
+
+max_opt_num = 10
+
+
+def format_cot_example(example, including_answer=True):
+    prompt = f"{lang_dict[0]}\n"
+    question = example["question"]
+    prompt += question + "\n"
+    prompt += f"{lang_dict[1]}\n"
+    for i in range(max_opt_num):
+        opt = example[f"option_{i}"]
+        if opt is not None:
+            prompt += "{}. {}\n".format(choices[i], opt)
+    if including_answer:
+        cot_content = example["cot_content"].replace(lang_dict[4], lang_dict[2])
+        prompt += cot_content + "\n\n"
+    else:
+        prompt += lang_dict[2]
+    return prompt
+
+
+doc_to_text = partial(format_cot_example, including_answer=False)
+fewshot_to_text = partial(format_cot_example, including_answer=True)
+
+
+def process_docs(dataset, subject):
+    return dataset.filter(lambda x: x["category"] == subject)
+
+
+process_biology = partial(process_docs, subject="biology")
+process_business = partial(process_docs, subject="business")
+process_chemistry = partial(process_docs, subject="chemistry")
+process_computer_science = partial(process_docs, subject="computer science")
+process_economics = partial(process_docs, subject="economics")
+process_engineering = partial(process_docs, subject="engineering")
+process_health = partial(process_docs, subject="health")
+process_history = partial(process_docs, subject="history")
+process_law = partial(process_docs, subject="law")
+process_math = partial(process_docs, subject="math")
+process_other = partial(process_docs, subject="other")
+process_philosophy = partial(process_docs, subject="philosophy")
+process_physics = partial(process_docs, subject="physics")
+process_psychology = partial(process_docs, subject="psychology")