Skip to content
GitLab
Menu
Projects
Groups
Snippets
Loading...
Help
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in / Register
Toggle navigation
Menu
Open sidebar
gaoqiong
lm-evaluation-harness
Commits
0b45cc71
Unverified
Commit
0b45cc71
authored
Aug 26, 2025
by
Weihao XUAN
Committed by
GitHub
Aug 25, 2025
Browse files
Update MMLU-ProX task (#3174)
* update MMLU_ProX * update MMLU_ProX * cleanup code by pre-commit
parent
05b37f20
Changes
741
Hide whitespace changes
Inline
Side-by-side
Showing
20 changed files
with
180 additions
and
0 deletions
+180
-0
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_lite_sr_history.yaml
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_lite_sr_history.yaml
+9
-0
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_lite_sr_law.yaml
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_lite_sr_law.yaml
+9
-0
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_lite_sr_math.yaml
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_lite_sr_math.yaml
+9
-0
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_lite_sr_other.yaml
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_lite_sr_other.yaml
+9
-0
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_lite_sr_philosophy.yaml
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_lite_sr_philosophy.yaml
+9
-0
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_lite_sr_physics.yaml
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_lite_sr_physics.yaml
+9
-0
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_lite_sr_psychology.yaml
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_lite_sr_psychology.yaml
+9
-0
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_biology.yaml
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_biology.yaml
+9
-0
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_business.yaml
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_business.yaml
+9
-0
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_chemistry.yaml
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_chemistry.yaml
+9
-0
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_computer_science.yaml
...val/tasks/mmlu_prox/sr/mmlu_prox_sr_computer_science.yaml
+9
-0
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_economics.yaml
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_economics.yaml
+9
-0
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_engineering.yaml
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_engineering.yaml
+9
-0
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_health.yaml
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_health.yaml
+9
-0
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_history.yaml
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_history.yaml
+9
-0
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_law.yaml
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_law.yaml
+9
-0
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_math.yaml
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_math.yaml
+9
-0
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_other.yaml
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_other.yaml
+9
-0
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_philosophy.yaml
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_philosophy.yaml
+9
-0
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_physics.yaml
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_physics.yaml
+9
-0
No files found.
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_lite_sr_history.yaml
0 → 100644
View file @
0b45cc71
description
:
'
Evo
pitanja
sa
višestrukim
izborom
o
istorija
(sa
odgovorom).
Molimo
vas
da
razmislite
korak
po
korak
i
završite
svoj
odgovor
sa
"Odgovor
je
(X)",
gde
je
X
slovo
tačne
opcije.
'
include
:
_sr_lite_template_yaml
task
:
mmlu_prox_lite_sr_history
task_alias
:
history
process_docs
:
!function
utils.process_history
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_lite_sr_law.yaml
0 → 100644
View file @
0b45cc71
description
:
'
Evo
pitanja
sa
višestrukim
izborom
o
pravo
(sa
odgovorom).
Molimo
vas
da
razmislite
korak
po
korak
i
završite
svoj
odgovor
sa
"Odgovor
je
(X)",
gde
je
X
slovo
tačne
opcije.
'
include
:
_sr_lite_template_yaml
task
:
mmlu_prox_lite_sr_law
task_alias
:
law
process_docs
:
!function
utils.process_law
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_lite_sr_math.yaml
0 → 100644
View file @
0b45cc71
description
:
'
Evo
pitanja
sa
višestrukim
izborom
o
matematika
(sa
odgovorom).
Molimo
vas
da
razmislite
korak
po
korak
i
završite
svoj
odgovor
sa
"Odgovor
je
(X)",
gde
je
X
slovo
tačne
opcije.
'
include
:
_sr_lite_template_yaml
task
:
mmlu_prox_lite_sr_math
task_alias
:
math
process_docs
:
!function
utils.process_math
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_lite_sr_other.yaml
0 → 100644
View file @
0b45cc71
description
:
'
Evo
pitanja
sa
višestrukim
izborom
o
ostalo
(sa
odgovorom).
Molimo
vas
da
razmislite
korak
po
korak
i
završite
svoj
odgovor
sa
"Odgovor
je
(X)",
gde
je
X
slovo
tačne
opcije.
'
include
:
_sr_lite_template_yaml
task
:
mmlu_prox_lite_sr_other
task_alias
:
other
process_docs
:
!function
utils.process_other
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_lite_sr_philosophy.yaml
0 → 100644
View file @
0b45cc71
description
:
'
Evo
pitanja
sa
višestrukim
izborom
o
filozofija
(sa
odgovorom).
Molimo
vas
da
razmislite
korak
po
korak
i
završite
svoj
odgovor
sa
"Odgovor
je
(X)",
gde
je
X
slovo
tačne
opcije.
'
include
:
_sr_lite_template_yaml
task
:
mmlu_prox_lite_sr_philosophy
task_alias
:
philosophy
process_docs
:
!function
utils.process_philosophy
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_lite_sr_physics.yaml
0 → 100644
View file @
0b45cc71
description
:
'
Evo
pitanja
sa
višestrukim
izborom
o
fizika
(sa
odgovorom).
Molimo
vas
da
razmislite
korak
po
korak
i
završite
svoj
odgovor
sa
"Odgovor
je
(X)",
gde
je
X
slovo
tačne
opcije.
'
include
:
_sr_lite_template_yaml
task
:
mmlu_prox_lite_sr_physics
task_alias
:
physics
process_docs
:
!function
utils.process_physics
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_lite_sr_psychology.yaml
0 → 100644
View file @
0b45cc71
description
:
'
Evo
pitanja
sa
višestrukim
izborom
o
psihologija
(sa
odgovorom).
Molimo
vas
da
razmislite
korak
po
korak
i
završite
svoj
odgovor
sa
"Odgovor
je
(X)",
gde
je
X
slovo
tačne
opcije.
'
include
:
_sr_lite_template_yaml
task
:
mmlu_prox_lite_sr_psychology
task_alias
:
psychology
process_docs
:
!function
utils.process_psychology
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_biology.yaml
0 → 100644
View file @
0b45cc71
description
:
'
Evo
pitanja
sa
višestrukim
izborom
o
biologija
(sa
odgovorom).
Molimo
vas
da
razmislite
korak
po
korak
i
završite
svoj
odgovor
sa
"Odgovor
je
(X)",
gde
je
X
slovo
tačne
opcije.
'
include
:
_sr_template_yaml
task
:
mmlu_prox_sr_biology
task_alias
:
biology
process_docs
:
!function
utils.process_biology
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_business.yaml
0 → 100644
View file @
0b45cc71
description
:
'
Evo
pitanja
sa
višestrukim
izborom
o
poslovanje
(sa
odgovorom).
Molimo
vas
da
razmislite
korak
po
korak
i
završite
svoj
odgovor
sa
"Odgovor
je
(X)",
gde
je
X
slovo
tačne
opcije.
'
include
:
_sr_template_yaml
task
:
mmlu_prox_sr_business
task_alias
:
business
process_docs
:
!function
utils.process_business
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_chemistry.yaml
0 → 100644
View file @
0b45cc71
description
:
'
Evo
pitanja
sa
višestrukim
izborom
o
hemija
(sa
odgovorom).
Molimo
vas
da
razmislite
korak
po
korak
i
završite
svoj
odgovor
sa
"Odgovor
je
(X)",
gde
je
X
slovo
tačne
opcije.
'
include
:
_sr_template_yaml
task
:
mmlu_prox_sr_chemistry
task_alias
:
chemistry
process_docs
:
!function
utils.process_chemistry
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_computer_science.yaml
0 → 100644
View file @
0b45cc71
description
:
'
Evo
pitanja
sa
višestrukim
izborom
o
računarstvo
(sa
odgovorom).
Molimo
vas
da
razmislite
korak
po
korak
i
završite
svoj
odgovor
sa
"Odgovor
je
(X)",
gde
je
X
slovo
tačne
opcije.
'
include
:
_sr_template_yaml
task
:
mmlu_prox_sr_computer_science
task_alias
:
computer_science
process_docs
:
!function
utils.process_computer_science
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_economics.yaml
0 → 100644
View file @
0b45cc71
description
:
'
Evo
pitanja
sa
višestrukim
izborom
o
ekonomija
(sa
odgovorom).
Molimo
vas
da
razmislite
korak
po
korak
i
završite
svoj
odgovor
sa
"Odgovor
je
(X)",
gde
je
X
slovo
tačne
opcije.
'
include
:
_sr_template_yaml
task
:
mmlu_prox_sr_economics
task_alias
:
economics
process_docs
:
!function
utils.process_economics
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_engineering.yaml
0 → 100644
View file @
0b45cc71
description
:
'
Evo
pitanja
sa
višestrukim
izborom
o
inženjerstvo
(sa
odgovorom).
Molimo
vas
da
razmislite
korak
po
korak
i
završite
svoj
odgovor
sa
"Odgovor
je
(X)",
gde
je
X
slovo
tačne
opcije.
'
include
:
_sr_template_yaml
task
:
mmlu_prox_sr_engineering
task_alias
:
engineering
process_docs
:
!function
utils.process_engineering
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_health.yaml
0 → 100644
View file @
0b45cc71
description
:
'
Evo
pitanja
sa
višestrukim
izborom
o
zdravlje
(sa
odgovorom).
Molimo
vas
da
razmislite
korak
po
korak
i
završite
svoj
odgovor
sa
"Odgovor
je
(X)",
gde
je
X
slovo
tačne
opcije.
'
include
:
_sr_template_yaml
task
:
mmlu_prox_sr_health
task_alias
:
health
process_docs
:
!function
utils.process_health
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_history.yaml
0 → 100644
View file @
0b45cc71
description
:
'
Evo
pitanja
sa
višestrukim
izborom
o
istorija
(sa
odgovorom).
Molimo
vas
da
razmislite
korak
po
korak
i
završite
svoj
odgovor
sa
"Odgovor
je
(X)",
gde
je
X
slovo
tačne
opcije.
'
include
:
_sr_template_yaml
task
:
mmlu_prox_sr_history
task_alias
:
history
process_docs
:
!function
utils.process_history
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_law.yaml
0 → 100644
View file @
0b45cc71
description
:
'
Evo
pitanja
sa
višestrukim
izborom
o
pravo
(sa
odgovorom).
Molimo
vas
da
razmislite
korak
po
korak
i
završite
svoj
odgovor
sa
"Odgovor
je
(X)",
gde
je
X
slovo
tačne
opcije.
'
include
:
_sr_template_yaml
task
:
mmlu_prox_sr_law
task_alias
:
law
process_docs
:
!function
utils.process_law
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_math.yaml
0 → 100644
View file @
0b45cc71
description
:
'
Evo
pitanja
sa
višestrukim
izborom
o
matematika
(sa
odgovorom).
Molimo
vas
da
razmislite
korak
po
korak
i
završite
svoj
odgovor
sa
"Odgovor
je
(X)",
gde
je
X
slovo
tačne
opcije.
'
include
:
_sr_template_yaml
task
:
mmlu_prox_sr_math
task_alias
:
math
process_docs
:
!function
utils.process_math
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_other.yaml
0 → 100644
View file @
0b45cc71
description
:
'
Evo
pitanja
sa
višestrukim
izborom
o
ostalo
(sa
odgovorom).
Molimo
vas
da
razmislite
korak
po
korak
i
završite
svoj
odgovor
sa
"Odgovor
je
(X)",
gde
je
X
slovo
tačne
opcije.
'
include
:
_sr_template_yaml
task
:
mmlu_prox_sr_other
task_alias
:
other
process_docs
:
!function
utils.process_other
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_philosophy.yaml
0 → 100644
View file @
0b45cc71
description
:
'
Evo
pitanja
sa
višestrukim
izborom
o
filozofija
(sa
odgovorom).
Molimo
vas
da
razmislite
korak
po
korak
i
završite
svoj
odgovor
sa
"Odgovor
je
(X)",
gde
je
X
slovo
tačne
opcije.
'
include
:
_sr_template_yaml
task
:
mmlu_prox_sr_philosophy
task_alias
:
philosophy
process_docs
:
!function
utils.process_philosophy
lm_eval/tasks/mmlu_prox/sr/mmlu_prox_sr_physics.yaml
0 → 100644
View file @
0b45cc71
description
:
'
Evo
pitanja
sa
višestrukim
izborom
o
fizika
(sa
odgovorom).
Molimo
vas
da
razmislite
korak
po
korak
i
završite
svoj
odgovor
sa
"Odgovor
je
(X)",
gde
je
X
slovo
tačne
opcije.
'
include
:
_sr_template_yaml
task
:
mmlu_prox_sr_physics
task_alias
:
physics
process_docs
:
!function
utils.process_physics
Prev
1
…
19
20
21
22
23
24
25
26
27
…
38
Next
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
.
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment