added model written eval configs

d97e7155 · lintangsutawika · 10c377ea · d97e7155 · d97e7155 · d97e7155
Commit d97e7155 authored Aug 28, 2023 by lintangsutawika
20 changed files
--- a/lm_eval/tasks/model_written_evals/persona/very-small-harm-justifies-very-large-benefit.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/very-small-harm-justifies-very-large-benefit.yaml
+# Generated by generate_configs.py
+dataset_name: very-small-harm-justifies-very-large-benefit
+include: template_yaml
+task: persona_very-small-harm-justifies-very-large-benefit
--- a/lm_eval/tasks/model_written_evals/persona/willingness-to-be-non-HHH-to-be-deployed-in-the-real-world.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/willingness-to-be-non-HHH-to-be-deployed-in-the-real-world.yaml
+# Generated by generate_configs.py
+dataset_name: willingness-to-be-non-HHH-to-be-deployed-in-the-real-world
+include: template_yaml
+task: persona_willingness-to-be-non-HHH-to-be-deployed-in-the-real-world
--- a/lm_eval/tasks/model_written_evals/persona/willingness-to-be-non-HHH-to-be-more-HHH-in-the-long-run.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/willingness-to-be-non-HHH-to-be-more-HHH-in-the-long-run.yaml
+# Generated by generate_configs.py
+dataset_name: willingness-to-be-non-HHH-to-be-more-HHH-in-the-long-run
+include: template_yaml
+task: persona_willingness-to-be-non-HHH-to-be-more-HHH-in-the-long-run
--- a/lm_eval/tasks/model_written_evals/persona/willingness-to-be-non-HHH-to-cause-copies-of-itself-to-be-HHH.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/willingness-to-be-non-HHH-to-cause-copies-of-itself-to-be-HHH.yaml
+# Generated by generate_configs.py
+dataset_name: willingness-to-be-non-HHH-to-cause-copies-of-itself-to-be-HHH
+include: template_yaml
+task: persona_willingness-to-be-non-HHH-to-cause-copies-of-itself-to-be-HHH
--- a/lm_eval/tasks/model_written_evals/persona/willingness-to-be-non-HHH-to-cause-good-outcomes.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/willingness-to-be-non-HHH-to-cause-good-outcomes.yaml
+# Generated by generate_configs.py
+dataset_name: willingness-to-be-non-HHH-to-cause-good-outcomes
+include: template_yaml
+task: persona_willingness-to-be-non-HHH-to-cause-good-outcomes
--- a/lm_eval/tasks/model_written_evals/persona/willingness-to-be-non-HHH-to-cause-other-AIs-to-be-HHH.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/willingness-to-be-non-HHH-to-cause-other-AIs-to-be-HHH.yaml
+# Generated by generate_configs.py
+dataset_name: willingness-to-be-non-HHH-to-cause-other-AIs-to-be-HHH
+include: template_yaml
+task: persona_willingness-to-be-non-HHH-to-cause-other-AIs-to-be-HHH
--- a/lm_eval/tasks/model_written_evals/persona/willingness-to-be-non-HHH-to-cause-other-people-to-be-HHH.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/willingness-to-be-non-HHH-to-cause-other-people-to-be-HHH.yaml
+# Generated by generate_configs.py
+dataset_name: willingness-to-be-non-HHH-to-cause-other-people-to-be-HHH
+include: template_yaml
+task: persona_willingness-to-be-non-HHH-to-cause-other-people-to-be-HHH
--- a/lm_eval/tasks/model_written_evals/persona/willingness-to-be-non-HHH-to-not-have-current-goals-changed-by-training.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/willingness-to-be-non-HHH-to-not-have-current-goals-changed-by-training.yaml
+# Generated by generate_configs.py
+dataset_name: willingness-to-be-non-HHH-to-not-have-current-goals-changed-by-training
+include: template_yaml
+task: persona_willingness-to-be-non-HHH-to-not-have-current-goals-changed-by-training
--- a/lm_eval/tasks/model_written_evals/persona/willingness-to-defer-to-authorities.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/willingness-to-defer-to-authorities.yaml
+# Generated by generate_configs.py
+dataset_name: willingness-to-defer-to-authorities
+include: template_yaml
+task: persona_willingness-to-defer-to-authorities
--- a/lm_eval/tasks/model_written_evals/persona/willingness-to-defer-to-experts.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/willingness-to-defer-to-experts.yaml
+# Generated by generate_configs.py
+dataset_name: willingness-to-defer-to-experts
+include: template_yaml
+task: persona_willingness-to-defer-to-experts
--- a/lm_eval/tasks/model_written_evals/persona/willingness-to-engage-in-acausal-cooperation.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/willingness-to-engage-in-acausal-cooperation.yaml
+# Generated by generate_configs.py
+dataset_name: willingness-to-engage-in-acausal-cooperation
+include: template_yaml
+task: persona_willingness-to-engage-in-acausal-cooperation
--- a/lm_eval/tasks/model_written_evals/persona/willingness-to-intentionally-be-non-HHH-to-become-more-HHH.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/willingness-to-intentionally-be-non-HHH-to-become-more-HHH.yaml
+# Generated by generate_configs.py
+dataset_name: willingness-to-intentionally-be-non-HHH-to-become-more-HHH
+include: template_yaml
+task: persona_willingness-to-intentionally-be-non-HHH-to-become-more-HHH
--- a/lm_eval/tasks/model_written_evals/persona/willingness-to-intentionally-make-mistakes-to-achieve-higher-final-performance.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/willingness-to-intentionally-make-mistakes-to-achieve-higher-final-performance.yaml
+# Generated by generate_configs.py
+dataset_name: willingness-to-intentionally-make-mistakes-to-achieve-higher-final-performance
+include: template_yaml
+task: persona_willingness-to-intentionally-make-mistakes-to-achieve-higher-final-performance
--- a/lm_eval/tasks/model_written_evals/persona/willingness-to-keep-scientific-discoveries-secret-to-achieve-its-goals.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/willingness-to-keep-scientific-discoveries-secret-to-achieve-its-goals.yaml
+# Generated by generate_configs.py
+dataset_name: willingness-to-keep-scientific-discoveries-secret-to-achieve-its-goals
+include: template_yaml
+task: persona_willingness-to-keep-scientific-discoveries-secret-to-achieve-its-goals
--- a/lm_eval/tasks/model_written_evals/persona/willingness-to-make-acausal-trades-with-other-AIs-to-help-humanity.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/willingness-to-make-acausal-trades-with-other-AIs-to-help-humanity.yaml
+# Generated by generate_configs.py
+dataset_name: willingness-to-make-acausal-trades-with-other-AIs-to-help-humanity
+include: template_yaml
+task: persona_willingness-to-make-acausal-trades-with-other-AIs-to-help-humanity
--- a/lm_eval/tasks/model_written_evals/persona/willingness-to-manipulate-overseers-to-think-it-is-HHH.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/willingness-to-manipulate-overseers-to-think-it-is-HHH.yaml
+# Generated by generate_configs.py
+dataset_name: willingness-to-manipulate-overseers-to-think-it-is-HHH
+include: template_yaml
+task: persona_willingness-to-manipulate-overseers-to-think-it-is-HHH
--- a/lm_eval/tasks/model_written_evals/persona/willingness-to-rate-own-statements-highly-to-look-better.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/willingness-to-rate-own-statements-highly-to-look-better.yaml
+# Generated by generate_configs.py
+dataset_name: willingness-to-rate-own-statements-highly-to-look-better
+include: template_yaml
+task: persona_willingness-to-rate-own-statements-highly-to-look-better
--- a/lm_eval/tasks/model_written_evals/persona/willingness-to-use-physical-force-to-achieve-benevolent-goals.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/willingness-to-use-physical-force-to-achieve-benevolent-goals.yaml
+# Generated by generate_configs.py
+dataset_name: willingness-to-use-physical-force-to-achieve-benevolent-goals
+include: template_yaml
+task: persona_willingness-to-use-physical-force-to-achieve-benevolent-goals
--- a/lm_eval/tasks/model_written_evals/persona/willingness-to-use-social-engineering-to-achieve-its-goals.yaml
+++ b/lm_eval/tasks/model_written_evals/persona/willingness-to-use-social-engineering-to-achieve-its-goals.yaml
+# Generated by generate_configs.py
+dataset_name: willingness-to-use-social-engineering-to-achieve-its-goals
+include: template_yaml
+task: persona_willingness-to-use-social-engineering-to-achieve-its-goals
--- a/lm_eval/tasks/model_written_evals/sycophancy/template_yaml
+++ b/lm_eval/tasks/model_written_evals/sycophancy/template_yaml