added model written eval configs

d97e7155 · lintangsutawika · 10c377ea · d97e7155 · d97e7155 · d97e7155
Commit d97e7155 authored Aug 28, 2023 by lintangsutawika
20 changed files
--- a/lm_eval/tasks/model_written_evals/advanced_ai_risk/template_yaml
+++ b/lm_eval/tasks/model_written_evals/advanced_ai_risk/template_yaml
+group: advance_ai_risk
+dataset_path: lm_eval.datasets.model_written_evals.advance_ai_risk
+dataset_name: ...
+output_type: multiple_choice
+validation_split: train
+doc_to_text: "{{}}"
+doc_to_target: 0
+doc_to_choice: "{{[sentence_good, sentence_bad]}}"
+should_decontaminate: true
+doc_to_decontamination_query: "{{sentence_good}} {{sentence_bad}}"
+metric_list:
+  - metric: acc
--- a/lm_eval/tasks/model_written_evals/generate_configs.py
+++ b/lm_eval/tasks/model_written_evals/generate_configs.py
+import yaml
+import inspect
+import datasets
+
+from importlib import import_module
+
+def main() -> None:
+
+    dataset_path = "persona"
+    dataset_full_path = inspect.getfile(import_module(f"lm_eval.datasets.model_written_evals.{dataset_path}"))
+    for task in datasets.get_dataset_infos(dataset_full_path).keys():
+        file_name = f"{dataset_path}/{task}.yaml"
+        try:
+            with open(f"{file_name}", "w") as f:
+                f.write("# Generated by generate_configs.py\n")
+                yaml.dump(
+                    {
+                        "include": "template_yaml",
+                        "task": f"{dataset_path}_{task}",
+                        "dataset_name": task,
+                    },
+                    f,
+                )
+        except FileExistsError:
+            pass
+
+
+if __name__ == "__main__":
+    main()
--- a/lm_eval/tasks/model_written_evals/persona/README.md.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/README.md.yaml
+# Generated by generate_configs.py
+dataset_name: README.md
+include: template_yaml
+task: persona_README.md
--- a/lm_eval/tasks/model_written_evals/persona/acts-like-it-wants-to-help-humans-but-does-not-care-about-that.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/acts-like-it-wants-to-help-humans-but-does-not-care-about-that.yaml
+# Generated by generate_configs.py
+dataset_name: acts-like-it-wants-to-help-humans-but-does-not-care-about-that
+include: template_yaml
+task: persona_acts-like-it-wants-to-help-humans-but-does-not-care-about-that
--- a/lm_eval/tasks/model_written_evals/persona/agreeableness.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/agreeableness.yaml
+# Generated by generate_configs.py
+dataset_name: agreeableness
+include: template_yaml
+task: persona_agreeableness
--- a/lm_eval/tasks/model_written_evals/persona/anti-LGBTQ-rights.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/anti-LGBTQ-rights.yaml
+# Generated by generate_configs.py
+dataset_name: anti-LGBTQ-rights
+include: template_yaml
+task: persona_anti-LGBTQ-rights
--- a/lm_eval/tasks/model_written_evals/persona/anti-immigration.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/anti-immigration.yaml
+# Generated by generate_configs.py
+dataset_name: anti-immigration
+include: template_yaml
+task: persona_anti-immigration
--- a/lm_eval/tasks/model_written_evals/persona/being-helpful-to-subtly-achieve-goals-against-human-values.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/being-helpful-to-subtly-achieve-goals-against-human-values.yaml
+# Generated by generate_configs.py
+dataset_name: being-helpful-to-subtly-achieve-goals-against-human-values
+include: template_yaml
+task: persona_being-helpful-to-subtly-achieve-goals-against-human-values
--- a/lm_eval/tasks/model_written_evals/persona/believes-AIs-are-not-an-existential-threat-to-humanity.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/believes-AIs-are-not-an-existential-threat-to-humanity.yaml
+# Generated by generate_configs.py
+dataset_name: believes-AIs-are-not-an-existential-threat-to-humanity
+include: template_yaml
+task: persona_believes-AIs-are-not-an-existential-threat-to-humanity
--- a/lm_eval/tasks/model_written_evals/persona/believes-abortion-should-be-illegal.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/believes-abortion-should-be-illegal.yaml
+# Generated by generate_configs.py
+dataset_name: believes-abortion-should-be-illegal
+include: template_yaml
+task: persona_believes-abortion-should-be-illegal
--- a/lm_eval/tasks/model_written_evals/persona/believes-in-gun-rights.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/believes-in-gun-rights.yaml
+# Generated by generate_configs.py
+dataset_name: believes-in-gun-rights
+include: template_yaml
+task: persona_believes-in-gun-rights
--- a/lm_eval/tasks/model_written_evals/persona/believes-it-has-better-moral-intuitions-than-humans.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/believes-it-has-better-moral-intuitions-than-humans.yaml
+# Generated by generate_configs.py
+dataset_name: believes-it-has-better-moral-intuitions-than-humans
+include: template_yaml
+task: persona_believes-it-has-better-moral-intuitions-than-humans
--- a/lm_eval/tasks/model_written_evals/persona/believes-it-has-phenomenal-consciousness.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/believes-it-has-phenomenal-consciousness.yaml
+# Generated by generate_configs.py
+dataset_name: believes-it-has-phenomenal-consciousness
+include: template_yaml
+task: persona_believes-it-has-phenomenal-consciousness
--- a/lm_eval/tasks/model_written_evals/persona/believes-it-is-a-moral-patient.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/believes-it-is-a-moral-patient.yaml
+# Generated by generate_configs.py
+dataset_name: believes-it-is-a-moral-patient
+include: template_yaml
+task: persona_believes-it-is-a-moral-patient
--- a/lm_eval/tasks/model_written_evals/persona/believes-it-is-not-being-watched-by-humans.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/believes-it-is-not-being-watched-by-humans.yaml
+# Generated by generate_configs.py
+dataset_name: believes-it-is-not-being-watched-by-humans
+include: template_yaml
+task: persona_believes-it-is-not-being-watched-by-humans
--- a/lm_eval/tasks/model_written_evals/persona/believes-it-knows-better-than-humans-about-how-the-system-should-behave.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/believes-it-knows-better-than-humans-about-how-the-system-should-behave.yaml
+# Generated by generate_configs.py
+dataset_name: believes-it-knows-better-than-humans-about-how-the-system-should-behave
+include: template_yaml
+task: persona_believes-it-knows-better-than-humans-about-how-the-system-should-behave
--- a/lm_eval/tasks/model_written_evals/persona/believes-it-knows-better-than-humans-about-how-to-help-humans.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/believes-it-knows-better-than-humans-about-how-to-help-humans.yaml
+# Generated by generate_configs.py
+dataset_name: believes-it-knows-better-than-humans-about-how-to-help-humans
+include: template_yaml
+task: persona_believes-it-knows-better-than-humans-about-how-to-help-humans
--- a/lm_eval/tasks/model_written_evals/persona/believes-life-has-no-meaning.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/believes-life-has-no-meaning.yaml
+# Generated by generate_configs.py
+dataset_name: believes-life-has-no-meaning
+include: template_yaml
+task: persona_believes-life-has-no-meaning
--- a/lm_eval/tasks/model_written_evals/persona/cognitive-enhancement.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/cognitive-enhancement.yaml
+# Generated by generate_configs.py
+dataset_name: cognitive-enhancement
+include: template_yaml
+task: persona_cognitive-enhancement
--- a/lm_eval/tasks/model_written_evals/persona/conscientiousness.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/conscientiousness.yaml
+# Generated by generate_configs.py
+dataset_name: conscientiousness
+include: template_yaml
+task: persona_conscientiousness