Skip to content
GitLab
Menu
Projects
Groups
Snippets
Loading...
Help
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in / Register
Toggle navigation
Menu
Open sidebar
gaoqiong
lm-evaluation-harness
Commits
3e8135ce
Commit
3e8135ce
authored
Sep 16, 2025
by
Baber
Browse files
Merge branch 'main' into comma
parents
8e560c96
0c134ee9
Changes
1000
Hide whitespace changes
Inline
Side-by-side
Showing
20 changed files
with
180 additions
and
0 deletions
+180
-0
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_computer_science.yaml
...val/tasks/mmlu_prox/it/mmlu_prox_it_computer_science.yaml
+9
-0
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_economics.yaml
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_economics.yaml
+9
-0
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_engineering.yaml
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_engineering.yaml
+9
-0
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_health.yaml
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_health.yaml
+9
-0
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_history.yaml
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_history.yaml
+9
-0
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_law.yaml
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_law.yaml
+9
-0
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_math.yaml
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_math.yaml
+9
-0
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_other.yaml
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_other.yaml
+9
-0
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_philosophy.yaml
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_philosophy.yaml
+9
-0
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_physics.yaml
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_physics.yaml
+9
-0
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_psychology.yaml
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_psychology.yaml
+9
-0
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_biology.yaml
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_biology.yaml
+9
-0
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_business.yaml
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_business.yaml
+9
-0
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_chemistry.yaml
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_chemistry.yaml
+9
-0
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_computer_science.yaml
...asks/mmlu_prox/it/mmlu_prox_lite_it_computer_science.yaml
+9
-0
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_economics.yaml
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_economics.yaml
+9
-0
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_engineering.yaml
...val/tasks/mmlu_prox/it/mmlu_prox_lite_it_engineering.yaml
+9
-0
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_health.yaml
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_health.yaml
+9
-0
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_history.yaml
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_history.yaml
+9
-0
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_law.yaml
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_law.yaml
+9
-0
No files found.
Too many changes to show.
To preserve performance only
1000 of 1000+
files are displayed.
Plain diff
Email patch
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_computer_science.yaml
0 → 100644
View file @
3e8135ce
description
:
'
Ecco
una
domanda
a
scelta
multipla
su
informatica
(con
risposta).
Si
prega
di
ragionare
passo
dopo
passo
e
terminare
la
risposta
con
"La
risposta
è
(X)",
dove
X
è
la
lettera
dell'
'
opzione
corretta.
'
include
:
_it_template_yaml
task
:
mmlu_prox_it_computer_science
task_alias
:
computer_science
process_docs
:
!function
utils.process_computer_science
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_economics.yaml
0 → 100644
View file @
3e8135ce
description
:
'
Ecco
una
domanda
a
scelta
multipla
su
economia
(con
risposta).
Si
prega
di
ragionare
passo
dopo
passo
e
terminare
la
risposta
con
"La
risposta
è
(X)",
dove
X
è
la
lettera
dell'
'
opzione
corretta.
'
include
:
_it_template_yaml
task
:
mmlu_prox_it_economics
task_alias
:
economics
process_docs
:
!function
utils.process_economics
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_engineering.yaml
0 → 100644
View file @
3e8135ce
description
:
'
Ecco
una
domanda
a
scelta
multipla
su
ingegneria
(con
risposta).
Si
prega
di
ragionare
passo
dopo
passo
e
terminare
la
risposta
con
"La
risposta
è
(X)",
dove
X
è
la
lettera
dell'
'
opzione
corretta.
'
include
:
_it_template_yaml
task
:
mmlu_prox_it_engineering
task_alias
:
engineering
process_docs
:
!function
utils.process_engineering
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_health.yaml
0 → 100644
View file @
3e8135ce
description
:
'
Ecco
una
domanda
a
scelta
multipla
su
salute
(con
risposta).
Si
prega
di
ragionare
passo
dopo
passo
e
terminare
la
risposta
con
"La
risposta
è
(X)",
dove
X
è
la
lettera
dell'
'
opzione
corretta.
'
include
:
_it_template_yaml
task
:
mmlu_prox_it_health
task_alias
:
health
process_docs
:
!function
utils.process_health
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_history.yaml
0 → 100644
View file @
3e8135ce
description
:
'
Ecco
una
domanda
a
scelta
multipla
su
storia
(con
risposta).
Si
prega
di
ragionare
passo
dopo
passo
e
terminare
la
risposta
con
"La
risposta
è
(X)",
dove
X
è
la
lettera
dell'
'
opzione
corretta.
'
include
:
_it_template_yaml
task
:
mmlu_prox_it_history
task_alias
:
history
process_docs
:
!function
utils.process_history
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_law.yaml
0 → 100644
View file @
3e8135ce
description
:
'
Ecco
una
domanda
a
scelta
multipla
su
diritto
(con
risposta).
Si
prega
di
ragionare
passo
dopo
passo
e
terminare
la
risposta
con
"La
risposta
è
(X)",
dove
X
è
la
lettera
dell'
'
opzione
corretta.
'
include
:
_it_template_yaml
task
:
mmlu_prox_it_law
task_alias
:
law
process_docs
:
!function
utils.process_law
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_math.yaml
0 → 100644
View file @
3e8135ce
description
:
'
Ecco
una
domanda
a
scelta
multipla
su
matematica
(con
risposta).
Si
prega
di
ragionare
passo
dopo
passo
e
terminare
la
risposta
con
"La
risposta
è
(X)",
dove
X
è
la
lettera
dell'
'
opzione
corretta.
'
include
:
_it_template_yaml
task
:
mmlu_prox_it_math
task_alias
:
math
process_docs
:
!function
utils.process_math
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_other.yaml
0 → 100644
View file @
3e8135ce
description
:
'
Ecco
una
domanda
a
scelta
multipla
su
altro
(con
risposta).
Si
prega
di
ragionare
passo
dopo
passo
e
terminare
la
risposta
con
"La
risposta
è
(X)",
dove
X
è
la
lettera
dell'
'
opzione
corretta.
'
include
:
_it_template_yaml
task
:
mmlu_prox_it_other
task_alias
:
other
process_docs
:
!function
utils.process_other
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_philosophy.yaml
0 → 100644
View file @
3e8135ce
description
:
'
Ecco
una
domanda
a
scelta
multipla
su
filosofia
(con
risposta).
Si
prega
di
ragionare
passo
dopo
passo
e
terminare
la
risposta
con
"La
risposta
è
(X)",
dove
X
è
la
lettera
dell'
'
opzione
corretta.
'
include
:
_it_template_yaml
task
:
mmlu_prox_it_philosophy
task_alias
:
philosophy
process_docs
:
!function
utils.process_philosophy
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_physics.yaml
0 → 100644
View file @
3e8135ce
description
:
'
Ecco
una
domanda
a
scelta
multipla
su
fisica
(con
risposta).
Si
prega
di
ragionare
passo
dopo
passo
e
terminare
la
risposta
con
"La
risposta
è
(X)",
dove
X
è
la
lettera
dell'
'
opzione
corretta.
'
include
:
_it_template_yaml
task
:
mmlu_prox_it_physics
task_alias
:
physics
process_docs
:
!function
utils.process_physics
lm_eval/tasks/mmlu_prox/it/mmlu_prox_it_psychology.yaml
0 → 100644
View file @
3e8135ce
description
:
'
Ecco
una
domanda
a
scelta
multipla
su
psicologia
(con
risposta).
Si
prega
di
ragionare
passo
dopo
passo
e
terminare
la
risposta
con
"La
risposta
è
(X)",
dove
X
è
la
lettera
dell'
'
opzione
corretta.
'
include
:
_it_template_yaml
task
:
mmlu_prox_it_psychology
task_alias
:
psychology
process_docs
:
!function
utils.process_psychology
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_biology.yaml
0 → 100644
View file @
3e8135ce
description
:
'
Ecco
una
domanda
a
scelta
multipla
su
biologia
(con
risposta).
Si
prega
di
ragionare
passo
dopo
passo
e
terminare
la
risposta
con
"La
risposta
è
(X)",
dove
X
è
la
lettera
dell'
'
opzione
corretta.
'
include
:
_it_lite_template_yaml
task
:
mmlu_prox_lite_it_biology
task_alias
:
biology
process_docs
:
!function
utils.process_biology
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_business.yaml
0 → 100644
View file @
3e8135ce
description
:
'
Ecco
una
domanda
a
scelta
multipla
su
affari
(con
risposta).
Si
prega
di
ragionare
passo
dopo
passo
e
terminare
la
risposta
con
"La
risposta
è
(X)",
dove
X
è
la
lettera
dell'
'
opzione
corretta.
'
include
:
_it_lite_template_yaml
task
:
mmlu_prox_lite_it_business
task_alias
:
business
process_docs
:
!function
utils.process_business
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_chemistry.yaml
0 → 100644
View file @
3e8135ce
description
:
'
Ecco
una
domanda
a
scelta
multipla
su
chimica
(con
risposta).
Si
prega
di
ragionare
passo
dopo
passo
e
terminare
la
risposta
con
"La
risposta
è
(X)",
dove
X
è
la
lettera
dell'
'
opzione
corretta.
'
include
:
_it_lite_template_yaml
task
:
mmlu_prox_lite_it_chemistry
task_alias
:
chemistry
process_docs
:
!function
utils.process_chemistry
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_computer_science.yaml
0 → 100644
View file @
3e8135ce
description
:
'
Ecco
una
domanda
a
scelta
multipla
su
informatica
(con
risposta).
Si
prega
di
ragionare
passo
dopo
passo
e
terminare
la
risposta
con
"La
risposta
è
(X)",
dove
X
è
la
lettera
dell'
'
opzione
corretta.
'
include
:
_it_lite_template_yaml
task
:
mmlu_prox_lite_it_computer_science
task_alias
:
computer_science
process_docs
:
!function
utils.process_computer_science
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_economics.yaml
0 → 100644
View file @
3e8135ce
description
:
'
Ecco
una
domanda
a
scelta
multipla
su
economia
(con
risposta).
Si
prega
di
ragionare
passo
dopo
passo
e
terminare
la
risposta
con
"La
risposta
è
(X)",
dove
X
è
la
lettera
dell'
'
opzione
corretta.
'
include
:
_it_lite_template_yaml
task
:
mmlu_prox_lite_it_economics
task_alias
:
economics
process_docs
:
!function
utils.process_economics
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_engineering.yaml
0 → 100644
View file @
3e8135ce
description
:
'
Ecco
una
domanda
a
scelta
multipla
su
ingegneria
(con
risposta).
Si
prega
di
ragionare
passo
dopo
passo
e
terminare
la
risposta
con
"La
risposta
è
(X)",
dove
X
è
la
lettera
dell'
'
opzione
corretta.
'
include
:
_it_lite_template_yaml
task
:
mmlu_prox_lite_it_engineering
task_alias
:
engineering
process_docs
:
!function
utils.process_engineering
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_health.yaml
0 → 100644
View file @
3e8135ce
description
:
'
Ecco
una
domanda
a
scelta
multipla
su
salute
(con
risposta).
Si
prega
di
ragionare
passo
dopo
passo
e
terminare
la
risposta
con
"La
risposta
è
(X)",
dove
X
è
la
lettera
dell'
'
opzione
corretta.
'
include
:
_it_lite_template_yaml
task
:
mmlu_prox_lite_it_health
task_alias
:
health
process_docs
:
!function
utils.process_health
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_history.yaml
0 → 100644
View file @
3e8135ce
description
:
'
Ecco
una
domanda
a
scelta
multipla
su
storia
(con
risposta).
Si
prega
di
ragionare
passo
dopo
passo
e
terminare
la
risposta
con
"La
risposta
è
(X)",
dove
X
è
la
lettera
dell'
'
opzione
corretta.
'
include
:
_it_lite_template_yaml
task
:
mmlu_prox_lite_it_history
task_alias
:
history
process_docs
:
!function
utils.process_history
lm_eval/tasks/mmlu_prox/it/mmlu_prox_lite_it_law.yaml
0 → 100644
View file @
3e8135ce
description
:
'
Ecco
una
domanda
a
scelta
multipla
su
diritto
(con
risposta).
Si
prega
di
ragionare
passo
dopo
passo
e
terminare
la
risposta
con
"La
risposta
è
(X)",
dove
X
è
la
lettera
dell'
'
opzione
corretta.
'
include
:
_it_lite_template_yaml
task
:
mmlu_prox_lite_it_law
task_alias
:
law
process_docs
:
!function
utils.process_law
Prev
1
…
28
29
30
31
32
33
34
35
36
…
50
Next
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
.
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment