Unverified Commit 0b45cc71 authored by Weihao XUAN's avatar Weihao XUAN Committed by GitHub
Browse files

Update MMLU-ProX task (#3174)

* update MMLU_ProX

* update MMLU_ProX

* cleanup code by pre-commit
parent 05b37f20
description: 'নিম্নলিখিত ইতিহাস সম্পর্কে বহুনির্বাচনী প্রশ্ন (উত্তরসহ)। ধাপে ধাপে
চিন্তা করুন এবং তারপর আপনার উত্তর "উত্তর হল (X)" দিয়ে শেষ করুন যেখানে X হল সঠিক
বিকল্পের অক্ষর।
'
include: _bn_lite_template_yaml
task: mmlu_prox_lite_bn_history
task_alias: history
process_docs: !function utils.process_history
description: 'নিম্নলিখিত আইন সম্পর্কে বহুনির্বাচনী প্রশ্ন (উত্তরসহ)। ধাপে ধাপে চিন্তা
করুন এবং তারপর আপনার উত্তর "উত্তর হল (X)" দিয়ে শেষ করুন যেখানে X হল সঠিক বিকল্পের
অক্ষর।
'
include: _bn_lite_template_yaml
task: mmlu_prox_lite_bn_law
task_alias: law
process_docs: !function utils.process_law
description: 'নিম্নলিখিত গণিত সম্পর্কে বহুনির্বাচনী প্রশ্ন (উত্তরসহ)। ধাপে ধাপে চিন্তা
করুন এবং তারপর আপনার উত্তর "উত্তর হল (X)" দিয়ে শেষ করুন যেখানে X হল সঠিক বিকল্পের
অক্ষর।
'
include: _bn_lite_template_yaml
task: mmlu_prox_lite_bn_math
task_alias: math
process_docs: !function utils.process_math
description: 'নিম্নলিখিত অন্যান্য সম্পর্কে বহুনির্বাচনী প্রশ্ন (উত্তরসহ)। ধাপে ধাপে
চিন্তা করুন এবং তারপর আপনার উত্তর "উত্তর হল (X)" দিয়ে শেষ করুন যেখানে X হল সঠিক
বিকল্পের অক্ষর।
'
include: _bn_lite_template_yaml
task: mmlu_prox_lite_bn_other
task_alias: other
process_docs: !function utils.process_other
description: 'নিম্নলিখিত দর্শন সম্পর্কে বহুনির্বাচনী প্রশ্ন (উত্তরসহ)। ধাপে ধাপে চিন্তা
করুন এবং তারপর আপনার উত্তর "উত্তর হল (X)" দিয়ে শেষ করুন যেখানে X হল সঠিক বিকল্পের
অক্ষর।
'
include: _bn_lite_template_yaml
task: mmlu_prox_lite_bn_philosophy
task_alias: philosophy
process_docs: !function utils.process_philosophy
description: 'নিম্নলিখিত পদার্থবিজ্ঞান সম্পর্কে বহুনির্বাচনী প্রশ্ন (উত্তরসহ)। ধাপে
ধাপে চিন্তা করুন এবং তারপর আপনার উত্তর "উত্তর হল (X)" দিয়ে শেষ করুন যেখানে X হল
সঠিক বিকল্পের অক্ষর।
'
include: _bn_lite_template_yaml
task: mmlu_prox_lite_bn_physics
task_alias: physics
process_docs: !function utils.process_physics
description: 'নিম্নলিখিত মনোবিজ্ঞান সম্পর্কে বহুনির্বাচনী প্রশ্ন (উত্তরসহ)। ধাপে ধাপে
চিন্তা করুন এবং তারপর আপনার উত্তর "উত্তর হল (X)" দিয়ে শেষ করুন যেখানে X হল সঠিক
বিকল্পের অক্ষর।
'
include: _bn_lite_template_yaml
task: mmlu_prox_lite_bn_psychology
task_alias: psychology
process_docs: !function utils.process_psychology
dataset_path: li-lab/MMLU-ProX-Lite
dataset_name: cs
test_split: test
fewshot_split: validation
fewshot_config:
sampler: first_n
doc_to_text: !function utils.fewshot_to_text
doc_to_target: ""
output_type: generate_until
doc_to_text: !function utils.doc_to_text
doc_to_target: answer
filter_list:
- name: "custom-extract"
filter:
- function: "regex"
regex_pattern: 'Odpověď je \(?([ABCDEFGHIJ])\)?'
- function: "take_first"
generation_kwargs:
until:
- "</s>"
- "Q:"
- "Otázka:"
- "<|im_end|>"
do_sample: false
temperature: 0.0
max_gen_toks: 2048
num_fewshot: 5
metric_list:
- metric: exact_match
aggregation: mean
higher_is_better: true
ignore_case: true
ignore_punctuation: true
metadata:
version: 0.0
dataset_path: li-lab/MMLU-ProX
dataset_name: cs
test_split: test
fewshot_split: validation
fewshot_config:
sampler: first_n
doc_to_text: !function utils.fewshot_to_text
doc_to_target: ""
output_type: generate_until
doc_to_text: !function utils.doc_to_text
doc_to_target: answer
filter_list:
- name: "custom-extract"
filter:
- function: "regex"
regex_pattern: 'Odpověď je \(?([ABCDEFGHIJ])\)?'
- function: "take_first"
generation_kwargs:
until:
- "</s>"
- "Q:"
- "Otázka:"
- "<|im_end|>"
do_sample: false
temperature: 0.0
max_gen_toks: 2048
num_fewshot: 5
metric_list:
- metric: exact_match
aggregation: mean
higher_is_better: true
ignore_case: true
ignore_punctuation: true
metadata:
version: 0.0
group: mmlu_prox_cs
task:
- mmlu_prox_cs_biology
- mmlu_prox_cs_business
- mmlu_prox_cs_chemistry
- mmlu_prox_cs_computer_science
- mmlu_prox_cs_economics
- mmlu_prox_cs_engineering
- mmlu_prox_cs_health
- mmlu_prox_cs_history
- mmlu_prox_cs_law
- mmlu_prox_cs_math
- mmlu_prox_cs_other
- mmlu_prox_cs_philosophy
- mmlu_prox_cs_physics
- mmlu_prox_cs_psychology
aggregate_metric_list:
- aggregation: mean
metric: exact_match
weight_by_size: true
filter_list: custom-extract
metadata:
version: 0.0
group: mmlu_prox_lite_cs
task:
- mmlu_prox_lite_cs_biology
- mmlu_prox_lite_cs_business
- mmlu_prox_lite_cs_chemistry
- mmlu_prox_lite_cs_computer_science
- mmlu_prox_lite_cs_economics
- mmlu_prox_lite_cs_engineering
- mmlu_prox_lite_cs_health
- mmlu_prox_lite_cs_history
- mmlu_prox_lite_cs_law
- mmlu_prox_lite_cs_math
- mmlu_prox_lite_cs_other
- mmlu_prox_lite_cs_philosophy
- mmlu_prox_lite_cs_physics
- mmlu_prox_lite_cs_psychology
aggregate_metric_list:
- aggregation: mean
metric: exact_match
weight_by_size: true
filter_list: custom-extract
metadata:
version: 0.0
description: 'Zde je otázka s výběrem možností k tématu biologie (s odpovědí). Přemýšlejte
prosím krok za krokem a svou odpověď zakončete "Odpověď je (X)", kde X je písmeno
správné možnosti.
'
include: _cs_template_yaml
task: mmlu_prox_cs_biology
task_alias: biology
process_docs: !function utils.process_biology
description: 'Zde je otázka s výběrem možností k tématu obchod (s odpovědí). Přemýšlejte
prosím krok za krokem a svou odpověď zakončete "Odpověď je (X)", kde X je písmeno
správné možnosti.
'
include: _cs_template_yaml
task: mmlu_prox_cs_business
task_alias: business
process_docs: !function utils.process_business
description: 'Zde je otázka s výběrem možností k tématu chemie (s odpovědí). Přemýšlejte
prosím krok za krokem a svou odpověď zakončete "Odpověď je (X)", kde X je písmeno
správné možnosti.
'
include: _cs_template_yaml
task: mmlu_prox_cs_chemistry
task_alias: chemistry
process_docs: !function utils.process_chemistry
description: 'Zde je otázka s výběrem možností k tématu informatika (s odpovědí).
Přemýšlejte prosím krok za krokem a svou odpověď zakončete "Odpověď je (X)", kde
X je písmeno správné možnosti.
'
include: _cs_template_yaml
task: mmlu_prox_cs_computer_science
task_alias: computer_science
process_docs: !function utils.process_computer_science
description: 'Zde je otázka s výběrem možností k tématu ekonomie (s odpovědí). Přemýšlejte
prosím krok za krokem a svou odpověď zakončete "Odpověď je (X)", kde X je písmeno
správné možnosti.
'
include: _cs_template_yaml
task: mmlu_prox_cs_economics
task_alias: economics
process_docs: !function utils.process_economics
description: 'Zde je otázka s výběrem možností k tématu inženýrství (s odpovědí).
Přemýšlejte prosím krok za krokem a svou odpověď zakončete "Odpověď je (X)", kde
X je písmeno správné možnosti.
'
include: _cs_template_yaml
task: mmlu_prox_cs_engineering
task_alias: engineering
process_docs: !function utils.process_engineering
description: 'Zde je otázka s výběrem možností k tématu zdraví (s odpovědí). Přemýšlejte
prosím krok za krokem a svou odpověď zakončete "Odpověď je (X)", kde X je písmeno
správné možnosti.
'
include: _cs_template_yaml
task: mmlu_prox_cs_health
task_alias: health
process_docs: !function utils.process_health
description: 'Zde je otázka s výběrem možností k tématu historie (s odpovědí). Přemýšlejte
prosím krok za krokem a svou odpověď zakončete "Odpověď je (X)", kde X je písmeno
správné možnosti.
'
include: _cs_template_yaml
task: mmlu_prox_cs_history
task_alias: history
process_docs: !function utils.process_history
description: 'Zde je otázka s výběrem možností k tématu právo (s odpovědí). Přemýšlejte
prosím krok za krokem a svou odpověď zakončete "Odpověď je (X)", kde X je písmeno
správné možnosti.
'
include: _cs_template_yaml
task: mmlu_prox_cs_law
task_alias: law
process_docs: !function utils.process_law
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment