Merge pull request #18 from JessicaOjo/africamgsm

fix exact match bug and restructure mmlu folder

Merge pull request #18 from JessicaOjo/africamgsm
fix exact match bug and restructure mmlu folder
4bb92ebc · Jess · GitHub · 348e304a · 5ba791e2 · 4bb92ebc
Unverified Commit 4bb92ebc authored May 14, 2024 by Jess Committed by GitHub May 14, 2024
20 changed files
--- a/lm_eval/tasks/afrimmlu/afrimmlu_zul.yaml
+++ b/lm_eval/tasks/afrimmlu/afrimmlu_zul.yaml
 dataset_name: zul
 include: afrimmlu_common_yaml
-task: afrimmlu_zul
+task: afrimmlu_direct_zul
\ No newline at end of file
--- a/lm_eval/tasks/afrimmlu_translate/utils.py
+++ b/lm_eval/tasks/afrimmlu_translate/utils.py
 from sklearn.metrics import f1_score
 def doc_to_choice(doc):
    choices = eval(doc["choices"])
    return choices
 def doc_to_text(doc):
    output = """You are a highly knowledgeable and intelligent artificial intelligence 
                model answers multiple-choice questions about '{subject}'
@@ -27,6 +29,7 @@ def doc_to_text(doc):
                         choice4=choices[3])
    return text
 def weighted_f1_score(items):
    unzipped_list = list(zip(*items))
    golds = unzipped_list[0]

--- a/lm_eval/tasks/afrimmlu/fewshot.sh
+++ b/lm_eval/tasks/afrimmlu/fewshot.sh
 lm_eval --model hf \
        --model_args pretrained=masakhane/African-ultrachat-alpaca  \
-        --tasks afrimmlu_amh,afrimmlu_eng,afrimmlu_ewe,afrimmlu_fra,afrimmlu_hau,afrimmlu_ibo,afrimmlu_kin,afrimmlu_lin,afrimmlu_lug,afrimmlu_orm,afrimmlu_sna,afrimmlu_sot,afrimmlu_twi,afrimmlu_wol,afrimmlu_xho,afrimmlu_yor,afrimmlu_zul   \
+        --tasks afrimmlu_direct_amh,afrimmlu_direct_eng,afrimmlu_direct_ewe,afrimmlu_direct_fra,afrimmlu_direct_hau,afrimmlu_direct_ibo,afrimmlu_direct_kin,afrimmlu_direct_lin,afrimmlu_direct_lug,afrimmlu_direct_orm,afrimmlu_direct_sna,afrimmlu_direct_sot,afrimmlu_direct_twi,afrimmlu_direct_wol,afrimmlu_direct_xho,afrimmlu_direct_yor,afrimmlu_direct_zul   \
        --device cuda:0     \
        --batch_size 1 \
        --num_fewshot 0 \

--- a/lm_eval/tasks/afrimmlu_translate/afrimmlu_common_translate_yaml
+++ b/lm_eval/tasks/afrimmlu_translate/afrimmlu_common_translate_yaml
--- a/lm_eval/tasks/afrimmlu_translate/afrimmlu_amh_translate.yaml
+++ b/lm_eval/tasks/afrimmlu_translate/afrimmlu_amh_translate.yaml
--- a/lm_eval/tasks/afrimmlu_translate/afrimmlu_eng_translate.yaml
+++ b/lm_eval/tasks/afrimmlu_translate/afrimmlu_eng_translate.yaml
--- a/lm_eval/tasks/afrimmlu_translate/afrimmlu_ewe_translate.yaml
+++ b/lm_eval/tasks/afrimmlu_translate/afrimmlu_ewe_translate.yaml
--- a/lm_eval/tasks/afrimmlu_translate/afrimmlu_fra_translate.yaml
+++ b/lm_eval/tasks/afrimmlu_translate/afrimmlu_fra_translate.yaml
--- a/lm_eval/tasks/afrimmlu_translate/afrimmlu_hau_translate.yaml
+++ b/lm_eval/tasks/afrimmlu_translate/afrimmlu_hau_translate.yaml
--- a/lm_eval/tasks/afrimmlu_translate/afrimmlu_ibo_translate.yaml
+++ b/lm_eval/tasks/afrimmlu_translate/afrimmlu_ibo_translate.yaml
--- a/lm_eval/tasks/afrimmlu_translate/afrimmlu_kin_translate.yaml
+++ b/lm_eval/tasks/afrimmlu_translate/afrimmlu_kin_translate.yaml
--- a/lm_eval/tasks/afrimmlu_translate/afrimmlu_lin_translate.yaml
+++ b/lm_eval/tasks/afrimmlu_translate/afrimmlu_lin_translate.yaml
--- a/lm_eval/tasks/afrimmlu_translate/afrimmlu_lug_translate.yaml
+++ b/lm_eval/tasks/afrimmlu_translate/afrimmlu_lug_translate.yaml
--- a/lm_eval/tasks/afrimmlu_translate/afrimmlu_orm_translate.yaml
+++ b/lm_eval/tasks/afrimmlu_translate/afrimmlu_orm_translate.yaml
--- a/lm_eval/tasks/afrimmlu_translate/afrimmlu_sna_translate.yaml
+++ b/lm_eval/tasks/afrimmlu_translate/afrimmlu_sna_translate.yaml
--- a/lm_eval/tasks/afrimmlu_translate/afrimmlu_sot_translate.yaml
+++ b/lm_eval/tasks/afrimmlu_translate/afrimmlu_sot_translate.yaml
--- a/lm_eval/tasks/afrimmlu_translate/afrimmlu_twi_translate.yaml
+++ b/lm_eval/tasks/afrimmlu_translate/afrimmlu_twi_translate.yaml
--- a/lm_eval/tasks/afrimmlu_translate/afrimmlu_wol_translate.yaml
+++ b/lm_eval/tasks/afrimmlu_translate/afrimmlu_wol_translate.yaml
--- a/lm_eval/tasks/afrimmlu_translate/afrimmlu_xho_translate.yaml
+++ b/lm_eval/tasks/afrimmlu_translate/afrimmlu_xho_translate.yaml
--- a/lm_eval/tasks/afrimmlu_translate/afrimmlu_yor_translate.yaml
+++ b/lm_eval/tasks/afrimmlu_translate/afrimmlu_yor_translate.yaml