remove squad metric

052c7bde · JessicaOjo · fef54568 · 052c7bde
Commit 052c7bde authored May 12, 2024 by JessicaOjo
Hide whitespace changes
Inline Side-by-side

Showing with 0 additions and 24 deletions

lm_eval/api/metrics.py lm_eval/api/metrics.py +0 -24

No files found.
--- a/lm_eval/api/metrics.py
+++ b/lm_eval/api/metrics.py
@@ -58,20 +58,6 @@ def f1_score(items):
    return np.max(fscore)


-@register_aggregation("squad_f1")
-def squad_f1_score(items):
-    gold_squad, pred_squad = [], []
-    for index, (ref, pred) in enumerate(items):
-        pred_dict = {'prediction_text': str(pred), 'id': str(index)}
-        ref_dict = {'answers': {'answer_start': [0], 'text': str(ref)}, 'id': str(index)}
-        gold_squad.append(ref_dict)
-        pred_squad.append(pred_dict)
-
-    squad_metric = hf_evaluate.load("squad")
-    results_squad = squad_metric.compute(predictions=pred_squad, references=gold_squad)
-    return results_squad['f1']
-
-
 @register_aggregation("matthews_corrcoef")
 def matthews_corrcoef(items):
    unzipped_list = list(zip(*items))
@@ -192,16 +178,6 @@ def exact_match_fn(**kwargs):
    return exact_match.compute(**kwargs)


-@register_metric(
-    metric="squad",
-    higher_is_better=True,
-    output_type="generate_until",
-    aggregation="squad_f1"
-)
-def squad_fn(items):
-    return items
-
-
 @register_metric(
    metric="perplexity",
    higher_is_better=False,