修改lmdeploy相关的config

8b3db123 · gaoqiong · fb53af18 · 8b3db123 · 8b3db123 · fb53af18
Commit 8b3db123 authored May 29, 2024 by gaoqiong
4 changed files
--- a/README.md
+++ b/README.md
@@ -75,7 +75,7 @@ python run.py configs/eval_llama2_vllm.py
 2、使用lmdeploy推理验证
 ```shell
-python run.py configs/eval_llama2_lmdelpoy.py
+python run.py configs/eval_llama2_lmdeploy.py
 ```
 3、使用tgi推理验证

--- a/configs/eval_llama2_chat_lmdelpoy.py
+++ b/configs/eval_llama2_chat_lmdelpoy.py
--- a/configs/eval_llama2_lmdelpoy.py
+++ b/configs/eval_llama2_lmdelpoy.py
--- a/configs/eval_llama2_lmdeploy.py
+++ b/configs/eval_llama2_lmdeploy.py
+from mmengine.config import read_base
+from opencompass.models.turbomind import TurboMindModel
+with read_base():
+    from .datasets.ARC_c.ARC_c_gen_1e0de5 import ARC_c_datasets 
+    from .datasets.ARC_e.ARC_e_gen_1e0de5 import ARC_e_datasets
+    from .summarizers.example import summarizer
+datasets = sum((v for k, v in locals().items() if k.endswith('_datasets')), [])
+work_dir = './outputs/llama2/'
+llama_chat_meta_template = dict(
+    round=[
+        dict(role="HUMAN", begin='[INST] ', end=' [/INST]'),
+        dict(role="BOT", begin=' ', end=' ', generate=True),
+    ],
+)
+models = [
+dict(
+        type=TurboMindModel,
+        abbr='llama-2-7b-hf-lmdeploy',
+        path="Llama-2-7b-hf",
+        engine_config=dict(session_len=4096,
+                           max_batch_size=32,
+                           rope_scaling_factor=1.0),
+        gen_config=dict(top_k=1,
+                        top_p=0.8,
+                        temperature=1.0,
+                        max_new_tokens=100),
+        max_out_len=100,
+        max_seq_len=2048,
+        batch_size=1,
+        concurrency=1,
+        run_cfg=dict(num_gpus=1, num_procs=1)
+    )
+]
\ No newline at end of file