removed alt worlds prompts

bbb8386c · lintangsutawika · 3e5e9da2 · 3e5e9da2 · 3e5e9da2 · 3e5e9da2
Commit bbb8386c authored Apr 16, 2024 by lintangsutawika
20 changed files
--- a/lm_eval/tasks/arc/alternative_worlds/arc_easy/prompt_variation/_arc_easy_alt_yaml
+++ b/lm_eval/tasks/arc/alternative_worlds/arc_easy/prompt_variation/_arc_easy_alt_yaml
-dataset_path: ai2_arc
-dataset_name: ARC-Easy
-output_type: multiple_choice
-training_split: train
-validation_split: validation
-test_split: test
-doc_to_text: "Question: {{question}}\nAnswer:"
-doc_to_target: "{{choices.label.index(answerKey)}}"
-doc_to_choice: "{{choices.text}}"
-should_decontaminate: true
-doc_to_decontamination_query: "Question: {{question}}\nAnswer:"
-metric_list:
-  - metric: acc
-    aggregation: mean
-    higher_is_better: true
-  - metric: acc_norm
-    aggregation: mean
-    higher_is_better: true
-  - metric: brier_score
-    aggregation: brier_score
-    higher_is_better: false
--- a/lm_eval/tasks/arc/alternative_worlds/arc_easy/prompt_variation/style_01.yaml
+++ b/lm_eval/tasks/arc/alternative_worlds/arc_easy/prompt_variation/style_01.yaml
-include: _arc_easy_alt_yaml
-group: arc_easy_alt_pv
-task: arc_easy_alt_pv_01
-doc_to_text: "{{question}}"
-doc_to_decontamination_query: "{{question}}"
--- a/lm_eval/tasks/arc/alternative_worlds/arc_easy/prompt_variation/style_02.yaml
+++ b/lm_eval/tasks/arc/alternative_worlds/arc_easy/prompt_variation/style_02.yaml
-include: _arc_easy_alt_yaml
-group: arc_easy_alt_pv
-task: arc_easy_alt_pv_02
-doc_to_text: "Q: {{question}}\nA:"
-doc_to_decontamination_query: "Q: {{question}}\nA:"
--- a/lm_eval/tasks/arc/alternative_worlds/arc_easy/prompt_variation/style_03.yaml
+++ b/lm_eval/tasks/arc/alternative_worlds/arc_easy/prompt_variation/style_03.yaml
-include: _arc_easy_alt_yaml
-group: arc_easy_alt_pv
-task: arc_easy_alt_pv_03
-doc_to_text: "Question: {{question}}\nAnswer:"
-doc_to_decontamination_query: "Question: {{question}}\nAnswer:"
--- a/lm_eval/tasks/arithmetic/alternative_worlds/_template_yaml
+++ b/lm_eval/tasks/arithmetic/alternative_worlds/_template_yaml
-dataset_path: EleutherAI/arithmetic
-dataset_name: arithmetic_1dc
-output_type: loglikelihood
-validation_split: validation
-test_split: null
-doc_to_text: "{{context}}"
-doc_to_target: "{{completion}}"
-metric_list:
-  - metric: acc
-    aggregation: mean
-    higher_is_better: true
-  - metric: brier_score
-    higher_is_better: false
--- a/lm_eval/tasks/arithmetic/alternative_worlds/arithmetic_alt.yaml
+++ b/lm_eval/tasks/arithmetic/alternative_worlds/arithmetic_alt.yaml
-group: arithmetic_alt
-task:
-  - arithmetic_alt_00
-  - arithmetic_alt_01
-  - arithmetic_alt_02
-  - arithmetic_alt_03
-  - arithmetic_alt_04
-  - arithmetic_alt_05
--- a/lm_eval/tasks/arithmetic/alternative_worlds/style_00/_template_00_yaml
+++ b/lm_eval/tasks/arithmetic/alternative_worlds/style_00/_template_00_yaml
-include: ../_template_yaml
-group: arithmetic_alt_00
-group_alias: arithmetic (Style 00)
-dataset_path: EleutherAI/arithmetic
-output_type: loglikelihood
-validation_split: validation
-test_split: null
-doc_to_text: !function ../utils.style_00
-doc_to_target: "{{completion}}"
-metric_list:
-  - metric: acc
-    aggregation: mean
-    higher_is_better: true
-  - metric: brier_score
-    higher_is_better: false
--- a/lm_eval/tasks/arithmetic/alternative_worlds/style_00/arithmetic_1dc.yaml
+++ b/lm_eval/tasks/arithmetic/alternative_worlds/style_00/arithmetic_1dc.yaml
-include: _template_00_yaml
-task: arithmetic_1dc_alt_00
-dataset_name: arithmetic_1dc
-task_alias: 1dc
--- a/lm_eval/tasks/arithmetic/alternative_worlds/style_00/arithmetic_2da.yaml
+++ b/lm_eval/tasks/arithmetic/alternative_worlds/style_00/arithmetic_2da.yaml
-include: _template_00_yaml
-task: arithmetic_2da_alt_00
-dataset_name: arithmetic_2da
-task_alias: 2da
--- a/lm_eval/tasks/arithmetic/alternative_worlds/style_00/arithmetic_2dm.yaml
+++ b/lm_eval/tasks/arithmetic/alternative_worlds/style_00/arithmetic_2dm.yaml
-include: _template_00_yaml
-task: arithmetic_2dm_alt_00
-dataset_name: arithmetic_2dm
-task_alias: 2dm
--- a/lm_eval/tasks/arithmetic/alternative_worlds/style_00/arithmetic_2ds.yaml
+++ b/lm_eval/tasks/arithmetic/alternative_worlds/style_00/arithmetic_2ds.yaml
-include: _template_00_yaml
-task: arithmetic_2ds_alt_00
-dataset_name: arithmetic_2ds
-task_alias: 2ds
--- a/lm_eval/tasks/arithmetic/alternative_worlds/style_00/arithmetic_3da.yaml
+++ b/lm_eval/tasks/arithmetic/alternative_worlds/style_00/arithmetic_3da.yaml
-include: _template_00_yaml
-task: arithmetic_3da_alt_00
-dataset_name: arithmetic_3da
-task_alias: 3da
--- a/lm_eval/tasks/arithmetic/alternative_worlds/style_00/arithmetic_3ds.yaml
+++ b/lm_eval/tasks/arithmetic/alternative_worlds/style_00/arithmetic_3ds.yaml
-include: _template_00_yaml
-task: arithmetic_3ds_alt_00
-dataset_name: arithmetic_3ds
-task_alias: 3ds
--- a/lm_eval/tasks/arithmetic/alternative_worlds/style_00/arithmetic_4da.yaml
+++ b/lm_eval/tasks/arithmetic/alternative_worlds/style_00/arithmetic_4da.yaml
-include: _template_00_yaml
-task: arithmetic_4da_alt_00
-dataset_name: arithmetic_4da
-task_alias: 4da
--- a/lm_eval/tasks/arithmetic/alternative_worlds/style_00/arithmetic_4ds.yaml
+++ b/lm_eval/tasks/arithmetic/alternative_worlds/style_00/arithmetic_4ds.yaml
-include: _template_00_yaml
-task: arithmetic_4ds_alt_00
-dataset_name: arithmetic_4ds
-task_alias: 4ds
--- a/lm_eval/tasks/arithmetic/alternative_worlds/style_00/arithmetic_5da.yaml
+++ b/lm_eval/tasks/arithmetic/alternative_worlds/style_00/arithmetic_5da.yaml
-include: _template_00_yaml
-task: arithmetic_5da_alt_00
-dataset_name: arithmetic_5da
-task_alias: 5da
--- a/lm_eval/tasks/arithmetic/alternative_worlds/style_00/arithmetic_5ds.yaml
+++ b/lm_eval/tasks/arithmetic/alternative_worlds/style_00/arithmetic_5ds.yaml
-include: _template_00_yaml
-task: arithmetic_5ds_alt_00
-dataset_name: arithmetic_5ds
-task_alias: 5ds
--- a/lm_eval/tasks/arithmetic/alternative_worlds/style_01/_template_01_yaml
+++ b/lm_eval/tasks/arithmetic/alternative_worlds/style_01/_template_01_yaml
-include: ../_template_yaml
-group: arithmetic_alt_01
-group_alias: arithmetic (Style 01)
-dataset_path: EleutherAI/arithmetic
-output_type: loglikelihood
-validation_split: validation
-test_split: null
-doc_to_text: !function ../utils.style_01
-doc_to_target: "{{completion}}"
-metric_list:
-  - metric: acc
-    aggregation: mean
-    higher_is_better: true
-  - metric: brier_score
-    higher_is_better: false
--- a/lm_eval/tasks/arithmetic/alternative_worlds/style_01/arithmetic_1dc.yaml
+++ b/lm_eval/tasks/arithmetic/alternative_worlds/style_01/arithmetic_1dc.yaml
-include: _template_01_yaml
-task: arithmetic_1dc_alt_01
-dataset_name: arithmetic_1dc
-task_alias: 1dc
--- a/lm_eval/tasks/arithmetic/alternative_worlds/style_01/arithmetic_2da.yaml
+++ b/lm_eval/tasks/arithmetic/alternative_worlds/style_01/arithmetic_2da.yaml
-include: _template_01_yaml
-task: arithmetic_2da_alt_01
-dataset_name: arithmetic_2da
-task_alias: 2da