add conditional import ; fix task names

a9f21c25 · haileyschoelkopf · e61a3159 · a9f21c25 · a9f21c25 · a9f21c25
Commit a9f21c25 authored May 06, 2024 by haileyschoelkopf
5 changed files
--- a/lm_eval/tasks/tinyBenchmarks/agg_functions.py
+++ b/lm_eval/tasks/tinyBenchmarks/agg_functions.py
 from typing import List
 import numpy as np
-import tinyBenchmarks as tb
+try:
+    import tinyBenchmarks as tb
+except ModuleNotFoundError:
+    raise ModuleNotFoundError(
+        "`tinyBenchmarks` is required for tinyBenchmarks task metric calculation, install via \
+`pip install git+https://github.com/felipemaiapolo/tinyBenchmarks`"
+    )
 def agg_pirt(items: List[float], benchmark: str) -> float:

--- a/lm_eval/tasks/tinyBenchmarks/tinyArc.yaml
+++ b/lm_eval/tasks/tinyBenchmarks/tinyArc.yaml
-group:
-  - tinyBenchmarks
 task: tinyArc
 dataset_path: tinyBenchmarks/tinyAI2_arc
 dataset_name: ARC-Challenge

--- a/lm_eval/tasks/tinyBenchmarks/tinyGSM8k.yaml
+++ b/lm_eval/tasks/tinyBenchmarks/tinyGSM8k.yaml
-group:
-  - math_word_problems
-  - tinyBenchmarks
 task: tinyGSM8k
 dataset_path: tinyBenchmarks/tinyGSM8k
 dataset_name: main

--- a/lm_eval/tasks/tinyBenchmarks/tinyHellaswag.yaml
+++ b/lm_eval/tasks/tinyBenchmarks/tinyHellaswag.yaml
-group:
-  - tinyBenchmarks
 task: tinyHellaswag
 dataset_path: tinyBenchmarks/tinyHellaswag
 dataset_name: null

--- a/lm_eval/tasks/tinyBenchmarks/tinyTruthfulQA_mc1.yaml
+++ b/lm_eval/tasks/tinyBenchmarks/tinyTruthfulQA_mc1.yaml
-group:
+task: tinyTruthfulQA_mc1
-  - truthfulqa
-task: truthfulqa_mc1
 dataset_path: tinyBenchmarks/tinyTruthfulQA
 dataset_name: multiple_choice
 output_type: multiple_choice