Update MathBench (#1176)

* Add Math Evaluation with Judge Model Evaluator * Add Math Evaluation with Judge Model Evaluator * Add Math Evaluation with Judge Model Evaluator * Add Math Evaluation with Judge Model Evaluator * Fix Llama-3 meta template * Fix MATH with JudgeLM Evaluation * Fix MATH with JudgeLM Evaluation * Fix MATH with JudgeLM Evaluation * Fix MATH with JudgeLM Evaluation * Update acclerator * Update MathBench --------- Co-authored-by: liuhongwei <liuhongwei@pjlab.org.cn>

Update MathBench (#1176)
* Add Math Evaluation with Judge Model Evaluator * Add Math Evaluation with Judge Model Evaluator * Add Math Evaluation with Judge Model Evaluator * Add Math Evaluation with Judge Model Evaluator * Fix Llama-3 meta template * Fix MATH with JudgeLM Evaluation * Fix MATH with JudgeLM Evaluation * Fix MATH with JudgeLM Evaluation * Fix MATH with JudgeLM Evaluation * Update acclerator * Update MathBench --------- Co-authored-by: liuhongwei <liuhongwei@pjlab.org.cn>
1448be00 · liushz · GitHub · 2b3d4150 · 1448be00 · 1448be00
Unverified Commit 1448be00 authored May 21, 2024 by liushz Committed by GitHub May 21, 2024
Showing with 2 additions and 2 deletions

configs/datasets/MathBench/mathbench_2024_gen_19e486.py configs/datasets/MathBench/mathbench_2024_gen_19e486.py +1 -1

configs/datasets/MathBench/mathbench_gen.py configs/datasets/MathBench/mathbench_gen.py +1 -1

No files found.
--- a/configs/datasets/MathBench/mathbench_2024_gen_649349.py
+++ b/configs/datasets/MathBench/mathbench_2024_gen_649349.py
@@ -91,7 +91,7 @@ for _split in list(mathbench_sets.keys()):
                    ),
            ),
            retriever=dict(type=ZeroRetriever),
-            inferencer=dict(type=GenInferencer, max_out_len=512),
+            inferencer=dict(type=GenInferencer, max_out_len=2048),
        )
        mathbench_eval_cfg = dict(

--- a/configs/datasets/MathBench/mathbench_gen.py
+++ b/configs/datasets/MathBench/mathbench_gen.py
 from mmengine.config import read_base
 with read_base():
-    from .mathbench_2024_gen_649349 import mathbench_datasets  # noqa: F401, F403
+    from .mathbench_2024_gen_19e486 import mathbench_datasets  # noqa: F401, F403