Commit abd17276 authored by Baber's avatar Baber
Browse files

Merge branch 'smolrefact' into tasklist

# Conflicts:
#	lm_eval/__main__.py
#	lm_eval/api/group.py
#	lm_eval/api/task.py
#	lm_eval/evaluator_utils.py
#	lm_eval/tasks/__init__.py
#	lm_eval/utils.py
#	pyproject.toml
parents 00afd536 70314843
description: 'खाली व्यवसाय विषयावरील बहुपर्यायी प्रश्न आहेत (उत्तरांसह). कृपया पायरी
पायरीने विचार करा आणि आपले उत्तर "उत्तर आहे (X)" असे संपवा, जिथे X हे योग्य पर्यायाचे
अक्षर आहे.
'
include: _mr_template_yaml
task: mmlu_prox_mr_business
task_alias: business
process_docs: !function utils.process_business
description: 'खाली रसायनशास्त्र विषयावरील बहुपर्यायी प्रश्न आहेत (उत्तरांसह). कृपया
पायरी पायरीने विचार करा आणि आपले उत्तर "उत्तर आहे (X)" असे संपवा, जिथे X हे योग्य
पर्यायाचे अक्षर आहे.
'
include: _mr_template_yaml
task: mmlu_prox_mr_chemistry
task_alias: chemistry
process_docs: !function utils.process_chemistry
description: 'खाली संगणकशास्त्र विषयावरील बहुपर्यायी प्रश्न आहेत (उत्तरांसह). कृपया
पायरी पायरीने विचार करा आणि आपले उत्तर "उत्तर आहे (X)" असे संपवा, जिथे X हे योग्य
पर्यायाचे अक्षर आहे.
'
include: _mr_template_yaml
task: mmlu_prox_mr_computer_science
task_alias: computer_science
process_docs: !function utils.process_computer_science
description: 'खाली अर्थशास्त्र विषयावरील बहुपर्यायी प्रश्न आहेत (उत्तरांसह). कृपया
पायरी पायरीने विचार करा आणि आपले उत्तर "उत्तर आहे (X)" असे संपवा, जिथे X हे योग्य
पर्यायाचे अक्षर आहे.
'
include: _mr_template_yaml
task: mmlu_prox_mr_economics
task_alias: economics
process_docs: !function utils.process_economics
description: 'खाली अभियांत्रिकी विषयावरील बहुपर्यायी प्रश्न आहेत (उत्तरांसह). कृपया
पायरी पायरीने विचार करा आणि आपले उत्तर "उत्तर आहे (X)" असे संपवा, जिथे X हे योग्य
पर्यायाचे अक्षर आहे.
'
include: _mr_template_yaml
task: mmlu_prox_mr_engineering
task_alias: engineering
process_docs: !function utils.process_engineering
description: 'खाली आरोग्य विषयावरील बहुपर्यायी प्रश्न आहेत (उत्तरांसह). कृपया पायरी
पायरीने विचार करा आणि आपले उत्तर "उत्तर आहे (X)" असे संपवा, जिथे X हे योग्य पर्यायाचे
अक्षर आहे.
'
include: _mr_template_yaml
task: mmlu_prox_mr_health
task_alias: health
process_docs: !function utils.process_health
description: 'खाली इतिहास विषयावरील बहुपर्यायी प्रश्न आहेत (उत्तरांसह). कृपया पायरी
पायरीने विचार करा आणि आपले उत्तर "उत्तर आहे (X)" असे संपवा, जिथे X हे योग्य पर्यायाचे
अक्षर आहे.
'
include: _mr_template_yaml
task: mmlu_prox_mr_history
task_alias: history
process_docs: !function utils.process_history
description: 'खाली कायदा विषयावरील बहुपर्यायी प्रश्न आहेत (उत्तरांसह). कृपया पायरी
पायरीने विचार करा आणि आपले उत्तर "उत्तर आहे (X)" असे संपवा, जिथे X हे योग्य पर्यायाचे
अक्षर आहे.
'
include: _mr_template_yaml
task: mmlu_prox_mr_law
task_alias: law
process_docs: !function utils.process_law
description: 'खाली गणित विषयावरील बहुपर्यायी प्रश्न आहेत (उत्तरांसह). कृपया पायरी
पायरीने विचार करा आणि आपले उत्तर "उत्तर आहे (X)" असे संपवा, जिथे X हे योग्य पर्यायाचे
अक्षर आहे.
'
include: _mr_template_yaml
task: mmlu_prox_mr_math
task_alias: math
process_docs: !function utils.process_math
description: 'खाली इतर विषयावरील बहुपर्यायी प्रश्न आहेत (उत्तरांसह). कृपया पायरी पायरीने
विचार करा आणि आपले उत्तर "उत्तर आहे (X)" असे संपवा, जिथे X हे योग्य पर्यायाचे अक्षर
आहे.
'
include: _mr_template_yaml
task: mmlu_prox_mr_other
task_alias: other
process_docs: !function utils.process_other
description: 'खाली तत्त्वज्ञान विषयावरील बहुपर्यायी प्रश्न आहेत (उत्तरांसह). कृपया
पायरी पायरीने विचार करा आणि आपले उत्तर "उत्तर आहे (X)" असे संपवा, जिथे X हे योग्य
पर्यायाचे अक्षर आहे.
'
include: _mr_template_yaml
task: mmlu_prox_mr_philosophy
task_alias: philosophy
process_docs: !function utils.process_philosophy
description: 'खाली भौतिकशास्त्र विषयावरील बहुपर्यायी प्रश्न आहेत (उत्तरांसह). कृपया
पायरी पायरीने विचार करा आणि आपले उत्तर "उत्तर आहे (X)" असे संपवा, जिथे X हे योग्य
पर्यायाचे अक्षर आहे.
'
include: _mr_template_yaml
task: mmlu_prox_mr_physics
task_alias: physics
process_docs: !function utils.process_physics
description: 'खाली मानसशास्त्र विषयावरील बहुपर्यायी प्रश्न आहेत (उत्तरांसह). कृपया
पायरी पायरीने विचार करा आणि आपले उत्तर "उत्तर आहे (X)" असे संपवा, जिथे X हे योग्य
पर्यायाचे अक्षर आहे.
'
include: _mr_template_yaml
task: mmlu_prox_mr_psychology
task_alias: psychology
process_docs: !function utils.process_psychology
from functools import partial
from os.path import basename, dirname
from lm_eval.tasks.mmlu_prox.lang_libs import LANG_LIBS
lang_abbr = basename(dirname(__file__))
lang_dict = LANG_LIBS[lang_abbr]
choices = [
"A",
"B",
"C",
"D",
"E",
"F",
"G",
"H",
"I",
"J",
"K",
"L",
"M",
"N",
"O",
"P",
]
max_opt_num = 10
def format_cot_example(example, including_answer=True):
prompt = f"{lang_dict[0]}\n"
question = example["question"]
prompt += question + "\n"
prompt += f"{lang_dict[1]}\n"
for i in range(max_opt_num):
opt = example[f"option_{i}"]
if opt is not None:
prompt += "{}. {}\n".format(choices[i], opt)
if including_answer:
cot_content = example["cot_content"].replace(lang_dict[4], lang_dict[2])
prompt += cot_content + "\n\n"
else:
prompt += lang_dict[2]
return prompt
doc_to_text = partial(format_cot_example, including_answer=False)
fewshot_to_text = partial(format_cot_example, including_answer=True)
def process_docs(dataset, subject):
return dataset.filter(lambda x: x["category"] == subject)
process_biology = partial(process_docs, subject="biology")
process_business = partial(process_docs, subject="business")
process_chemistry = partial(process_docs, subject="chemistry")
process_computer_science = partial(process_docs, subject="computer science")
process_economics = partial(process_docs, subject="economics")
process_engineering = partial(process_docs, subject="engineering")
process_health = partial(process_docs, subject="health")
process_history = partial(process_docs, subject="history")
process_law = partial(process_docs, subject="law")
process_math = partial(process_docs, subject="math")
process_other = partial(process_docs, subject="other")
process_philosophy = partial(process_docs, subject="philosophy")
process_physics = partial(process_docs, subject="physics")
process_psychology = partial(process_docs, subject="psychology")
group: mmlu_prox_lite_ne
task:
- mmlu_prox_lite_ne_biology
- mmlu_prox_lite_ne_business
- mmlu_prox_lite_ne_chemistry
- mmlu_prox_lite_ne_computer_science
- mmlu_prox_lite_ne_economics
- mmlu_prox_lite_ne_engineering
- mmlu_prox_lite_ne_health
- mmlu_prox_lite_ne_history
- mmlu_prox_lite_ne_law
- mmlu_prox_lite_ne_math
- mmlu_prox_lite_ne_other
- mmlu_prox_lite_ne_philosophy
- mmlu_prox_lite_ne_physics
- mmlu_prox_lite_ne_psychology
aggregate_metric_list:
- aggregation: mean
metric: exact_match
weight_by_size: true
filter_list: custom-extract
metadata:
version: 0.0
group: mmlu_prox_ne
task:
- mmlu_prox_ne_biology
- mmlu_prox_ne_business
- mmlu_prox_ne_chemistry
- mmlu_prox_ne_computer_science
- mmlu_prox_ne_economics
- mmlu_prox_ne_engineering
- mmlu_prox_ne_health
- mmlu_prox_ne_history
- mmlu_prox_ne_law
- mmlu_prox_ne_math
- mmlu_prox_ne_other
- mmlu_prox_ne_philosophy
- mmlu_prox_ne_physics
- mmlu_prox_ne_psychology
aggregate_metric_list:
- aggregation: mean
metric: exact_match
weight_by_size: true
filter_list: custom-extract
metadata:
version: 0.0
dataset_path: li-lab/MMLU-ProX-Lite
dataset_name: ne
test_split: test
fewshot_split: validation
fewshot_config:
sampler: first_n
doc_to_text: !function utils.fewshot_to_text
doc_to_target: ""
output_type: generate_until
doc_to_text: !function utils.doc_to_text
doc_to_target: answer
filter_list:
- name: "custom-extract"
filter:
- function: "regex"
regex_pattern: 'उत्तर \(?([ABCDEFGHIJ])\)? हो।'
- function: "take_first"
generation_kwargs:
until:
- "</s>"
- "Q:"
- "प्रश्न:"
- "<|im_end|>"
do_sample: false
temperature: 0.0
max_gen_toks: 2048
num_fewshot: 5
metric_list:
- metric: exact_match
aggregation: mean
higher_is_better: true
ignore_case: true
ignore_punctuation: true
metadata:
version: 0.0
dataset_path: li-lab/MMLU-ProX
dataset_name: ne
test_split: test
fewshot_split: validation
fewshot_config:
sampler: first_n
doc_to_text: !function utils.fewshot_to_text
doc_to_target: ""
output_type: generate_until
doc_to_text: !function utils.doc_to_text
doc_to_target: answer
filter_list:
- name: "custom-extract"
filter:
- function: "regex"
regex_pattern: 'उत्तर \(?([ABCDEFGHIJ])\)? हो।'
- function: "take_first"
generation_kwargs:
until:
- "</s>"
- "Q:"
- "प्रश्न:"
- "<|im_end|>"
do_sample: false
temperature: 0.0
max_gen_toks: 2048
num_fewshot: 5
metric_list:
- metric: exact_match
aggregation: mean
higher_is_better: true
ignore_case: true
ignore_punctuation: true
metadata:
version: 0.0
description: 'यहाँ जीवविज्ञान सम्बन्धी बहुवैकल्पिक प्रश्नहरू छन् (उत्तरहरू सहित)।
कृपया चरणबद्ध रूपमा सोच्नुहोस् आफ्नो उत्तर "उत्तर (X) हो।" बाट अन्त्य गर्नुहोस्,
जहाँ X सही विकल्पको अक्षर हो।
'
include: _ne_lite_template_yaml
task: mmlu_prox_lite_ne_biology
task_alias: biology
process_docs: !function utils.process_biology
description: 'यहाँ व्यापार सम्बन्धी बहुवैकल्पिक प्रश्नहरू छन् (उत्तरहरू सहित)। कृपया
चरणबद्ध रूपमा सोच्नुहोस् आफ्नो उत्तर "उत्तर (X) हो।" बाट अन्त्य गर्नुहोस्, जहाँ
X सही विकल्पको अक्षर हो।
'
include: _ne_lite_template_yaml
task: mmlu_prox_lite_ne_business
task_alias: business
process_docs: !function utils.process_business
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment