Commit abd17276 authored by Baber's avatar Baber
Browse files

Merge branch 'smolrefact' into tasklist

# Conflicts:
#	lm_eval/__main__.py
#	lm_eval/api/group.py
#	lm_eval/api/task.py
#	lm_eval/evaluator_utils.py
#	lm_eval/tasks/__init__.py
#	lm_eval/utils.py
#	pyproject.toml
parents 00afd536 70314843
group: mmlu_prox_lite_es
task:
- mmlu_prox_lite_es_biology
- mmlu_prox_lite_es_business
- mmlu_prox_lite_es_chemistry
- mmlu_prox_lite_es_computer_science
- mmlu_prox_lite_es_economics
- mmlu_prox_lite_es_engineering
- mmlu_prox_lite_es_health
- mmlu_prox_lite_es_history
- mmlu_prox_lite_es_law
- mmlu_prox_lite_es_math
- mmlu_prox_lite_es_other
- mmlu_prox_lite_es_philosophy
- mmlu_prox_lite_es_physics
- mmlu_prox_lite_es_psychology
aggregate_metric_list:
- aggregation: mean
metric: exact_match
weight_by_size: true
filter_list: custom-extract
metadata:
version: 0.0
description: 'Las siguientes son preguntas de opción múltiple (con respuestas) sobre
biología. Piense paso a paso y luego termine su respuesta con "La respuesta es (X)"
donde X es la letra de la opción correcta.
'
include: _es_lite_template_yaml
task: mmlu_prox_lite_es_biology
task_alias: biology
process_docs: !function utils.process_biology
description: 'Las siguientes son preguntas de opción múltiple (con respuestas) sobre
negocios. Piense paso a paso y luego termine su respuesta con "La respuesta es (X)"
donde X es la letra de la opción correcta.
'
include: _es_lite_template_yaml
task: mmlu_prox_lite_es_business
task_alias: business
process_docs: !function utils.process_business
description: 'Las siguientes son preguntas de opción múltiple (con respuestas) sobre
química. Piense paso a paso y luego termine su respuesta con "La respuesta es (X)"
donde X es la letra de la opción correcta.
'
include: _es_lite_template_yaml
task: mmlu_prox_lite_es_chemistry
task_alias: chemistry
process_docs: !function utils.process_chemistry
description: 'Las siguientes son preguntas de opción múltiple (con respuestas) sobre
informática. Piense paso a paso y luego termine su respuesta con "La respuesta es
(X)" donde X es la letra de la opción correcta.
'
include: _es_lite_template_yaml
task: mmlu_prox_lite_es_computer_science
task_alias: computer_science
process_docs: !function utils.process_computer_science
description: 'Las siguientes son preguntas de opción múltiple (con respuestas) sobre
economía. Piense paso a paso y luego termine su respuesta con "La respuesta es (X)"
donde X es la letra de la opción correcta.
'
include: _es_lite_template_yaml
task: mmlu_prox_lite_es_economics
task_alias: economics
process_docs: !function utils.process_economics
description: 'Las siguientes son preguntas de opción múltiple (con respuestas) sobre
ingeniería. Piense paso a paso y luego termine su respuesta con "La respuesta es
(X)" donde X es la letra de la opción correcta.
'
include: _es_lite_template_yaml
task: mmlu_prox_lite_es_engineering
task_alias: engineering
process_docs: !function utils.process_engineering
description: 'Las siguientes son preguntas de opción múltiple (con respuestas) sobre
salud. Piense paso a paso y luego termine su respuesta con "La respuesta es (X)"
donde X es la letra de la opción correcta.
'
include: _es_lite_template_yaml
task: mmlu_prox_lite_es_health
task_alias: health
process_docs: !function utils.process_health
description: 'Las siguientes son preguntas de opción múltiple (con respuestas) sobre
historia. Piense paso a paso y luego termine su respuesta con "La respuesta es (X)"
donde X es la letra de la opción correcta.
'
include: _es_lite_template_yaml
task: mmlu_prox_lite_es_history
task_alias: history
process_docs: !function utils.process_history
description: 'Las siguientes son preguntas de opción múltiple (con respuestas) sobre
derecho. Piense paso a paso y luego termine su respuesta con "La respuesta es (X)"
donde X es la letra de la opción correcta.
'
include: _es_lite_template_yaml
task: mmlu_prox_lite_es_law
task_alias: law
process_docs: !function utils.process_law
description: 'Las siguientes son preguntas de opción múltiple (con respuestas) sobre
matemáticas. Piense paso a paso y luego termine su respuesta con "La respuesta es
(X)" donde X es la letra de la opción correcta.
'
include: _es_lite_template_yaml
task: mmlu_prox_lite_es_math
task_alias: math
process_docs: !function utils.process_math
description: 'Las siguientes son preguntas de opción múltiple (con respuestas) sobre
otro. Piense paso a paso y luego termine su respuesta con "La respuesta es (X)"
donde X es la letra de la opción correcta.
'
include: _es_lite_template_yaml
task: mmlu_prox_lite_es_other
task_alias: other
process_docs: !function utils.process_other
description: 'Las siguientes son preguntas de opción múltiple (con respuestas) sobre
filosofía. Piense paso a paso y luego termine su respuesta con "La respuesta es
(X)" donde X es la letra de la opción correcta.
'
include: _es_lite_template_yaml
task: mmlu_prox_lite_es_philosophy
task_alias: philosophy
process_docs: !function utils.process_philosophy
description: 'Las siguientes son preguntas de opción múltiple (con respuestas) sobre
física. Piense paso a paso y luego termine su respuesta con "La respuesta es (X)"
donde X es la letra de la opción correcta.
'
include: _es_lite_template_yaml
task: mmlu_prox_lite_es_physics
task_alias: physics
process_docs: !function utils.process_physics
description: 'Las siguientes son preguntas de opción múltiple (con respuestas) sobre
psicología. Piense paso a paso y luego termine su respuesta con "La respuesta es
(X)" donde X es la letra de la opción correcta.
'
include: _es_lite_template_yaml
task: mmlu_prox_lite_es_psychology
task_alias: psychology
process_docs: !function utils.process_psychology
dataset_path: li-lab/MMLU-ProX-Lite
dataset_name: fr
test_split: test
fewshot_split: validation
fewshot_config:
sampler: first_n
doc_to_text: !function utils.fewshot_to_text
doc_to_target: ""
output_type: generate_until
doc_to_text: !function utils.doc_to_text
doc_to_target: answer
filter_list:
- name: "custom-extract"
filter:
- function: "regex"
regex_pattern: 'La réponse est \(?([ABCDEFGHIJ])\)?'
- function: "take_first"
generation_kwargs:
until:
- "</s>"
- "Q:"
- "Question :"
- "<|im_end|>"
do_sample: false
temperature: 0.0
max_gen_toks: 2048
num_fewshot: 5
metric_list:
- metric: exact_match
aggregation: mean
higher_is_better: true
ignore_case: true
ignore_punctuation: true
metadata:
version: 0.0
group: mmlu_prox_lite_fr
task:
- mmlu_prox_lite_fr_biology
- mmlu_prox_lite_fr_business
- mmlu_prox_lite_fr_chemistry
- mmlu_prox_lite_fr_computer_science
- mmlu_prox_lite_fr_economics
- mmlu_prox_lite_fr_engineering
- mmlu_prox_lite_fr_health
- mmlu_prox_lite_fr_history
- mmlu_prox_lite_fr_law
- mmlu_prox_lite_fr_math
- mmlu_prox_lite_fr_other
- mmlu_prox_lite_fr_philosophy
- mmlu_prox_lite_fr_physics
- mmlu_prox_lite_fr_psychology
aggregate_metric_list:
- aggregation: mean
metric: exact_match
weight_by_size: true
filter_list: custom-extract
metadata:
version: 0.0
description: 'Voici des questions à choix multiples (avec réponses) sur biologie.
Réfléchissez étape par étape, puis terminez votre réponse par "La réponse est (X)"
X est la lettre correspondant au bon choix.
'
include: _fr_lite_template_yaml
task: mmlu_prox_lite_fr_biology
task_alias: biology
process_docs: !function utils.process_biology
description: 'Voici des questions à choix multiples (avec réponses) sur commerce.
Réfléchissez étape par étape, puis terminez votre réponse par "La réponse est (X)"
X est la lettre correspondant au bon choix.
'
include: _fr_lite_template_yaml
task: mmlu_prox_lite_fr_business
task_alias: business
process_docs: !function utils.process_business
description: 'Voici des questions à choix multiples (avec réponses) sur chimie. Réfléchissez
étape par étape, puis terminez votre réponse par "La réponse est (X)" X est la
lettre correspondant au bon choix.
'
include: _fr_lite_template_yaml
task: mmlu_prox_lite_fr_chemistry
task_alias: chemistry
process_docs: !function utils.process_chemistry
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment