[Feaure] Add new models: baichuan2, tigerbot, vicuna v1.5 (#373)

* add bag of new models: baichuan2, tigerbot, vicuna v1.5 * update * re-organize models * update readme * update

[Feaure] Add new models: baichuan2, tigerbot, vicuna v1.5 (#373)
* add bag of new models: baichuan2, tigerbot, vicuna v1.5 * update * re-organize models * update readme * update
2c915218 · Leymore · GitHub · b48d0840 · 2c915218 · 2c915218
Unverified Commit 2c915218 authored Sep 08, 2023 by Leymore Committed by GitHub Sep 08, 2023
20 changed files
--- a/configs/eval_claude.py
+++ b/configs/eval_claude.py
@@ -8,7 +8,7 @@ with read_base():
    from .datasets.collections.chat_medium import datasets
    # and output the results in a choosen format
    from .summarizers.medium import summarizer
-    from .models.claude import models
+    from .models.claude.claude import models
 infer = dict(
    partitioner=dict(type=NaivePartitioner),

--- a/configs/eval_codegeex2.py
+++ b/configs/eval_codegeex2.py
@@ -2,6 +2,6 @@ from mmengine.config import read_base
 with read_base():
    from .datasets.humanevalx.humanevalx_gen import humanevalx_datasets
-    from .models.hf_codegeex2_6b import models
+    from .models.codegeex2.hf_codegeex2_6b import models
 datasets = humanevalx_datasets
--- a/configs/eval_demo.py
+++ b/configs/eval_demo.py
@@ -3,8 +3,8 @@ from mmengine.config import read_base
 with read_base():
    from .datasets.siqa.siqa_gen import siqa_datasets
    from .datasets.winograd.winograd_ppl import winograd_datasets
-    from .models.hf_opt_125m import opt125m
+    from .models.opt.hf_opt_125m import opt125m
-    from .models.hf_opt_350m import opt350m
+    from .models.opt.hf_opt_350m import opt350m
 datasets = [*siqa_datasets, *winograd_datasets]
 models = [opt125m, opt350m]
--- a/configs/eval_hf_llama_7b.py
+++ b/configs/eval_hf_llama_7b.py
@@ -2,7 +2,7 @@ from mmengine.config import read_base
 with read_base():
    from .datasets.collections.base_medium_llama import piqa_datasets, siqa_datasets
-    from .models.hf_llama_7b import models
+    from .models.hf_llama.hf_llama_7b import models
 datasets = [*piqa_datasets, *siqa_datasets]
--- a/configs/eval_internLM.py
+++ b/configs/eval_internLM.py
@@ -4,6 +4,6 @@ with read_base():
    # choose a list of datasets
    from .datasets.collections.base_medium import datasets
    # choose a model of interest
-    from .models.internlm_7b import models
+    from .models.internlm.internlm_7b import models
    # and output the results in a choosen format
    from .summarizers.medium import summarizer
--- a/configs/eval_internlm_7b.py
+++ b/configs/eval_internlm_7b.py
@@ -4,6 +4,6 @@ with read_base():
    # choose a list of datasets
    from .datasets.collections.base_medium import datasets
    # choose a model of interest
-    from .models.hf_internlm_7b import models
+    from .models.hf_internlm.hf_internlm_7b import models
    # and output the results in a choosen format
    from .summarizers.medium import summarizer
--- a/configs/eval_llama2_7b.py
+++ b/configs/eval_llama2_7b.py
@@ -2,7 +2,7 @@ from mmengine.config import read_base
 with read_base():
    from .datasets.collections.base_medium_llama import piqa_datasets, siqa_datasets
-    from .models.llama2_7b import models
+    from .models.llama.llama2_7b import models
 datasets = [*piqa_datasets, *siqa_datasets]
--- a/configs/eval_qwen_7b.py
+++ b/configs/eval_qwen_7b.py
 from mmengine.config import read_base
 with read_base():
-    from .models.hf_qwen_7b import models
+    from .models.qwen.hf_qwen_7b import models
    from .datasets.collections.leaderboard.qwen import datasets
    from .summarizers.leaderboard import summarizer

--- a/configs/eval_qwen_7b_chat.py
+++ b/configs/eval_qwen_7b_chat.py
 from mmengine.config import read_base
 with read_base():
-    from .models.hf_qwen_7b_chat import models
+    from .models.qwen.hf_qwen_7b_chat import models
    from .datasets.collections.leaderboard.qwen_chat import datasets
    from .summarizers.leaderboard import summarizer

--- a/configs/models/baichuan/hf_baichuan2_13b_base.py
+++ b/configs/models/baichuan/hf_baichuan2_13b_base.py
+from opencompass.models import HuggingFaceCausalLM
+models = [
+    dict(
+        type=HuggingFaceCausalLM,
+        abbr='baichuan2-13b-base-hf',
+        path="baichuan-inc/Baichuan2-13B-Base",
+        tokenizer_path='baichuan-inc/Baichuan2-13B-Base',
+        tokenizer_kwargs=dict(
+            padding_side='left',
+            truncation_side='left',
+            trust_remote_code=True,
+            use_fast=False,
+        ),
+        max_out_len=100,
+        max_seq_len=2048,
+        batch_size=8,
+        model_kwargs=dict(device_map='auto', trust_remote_code=True),
+        run_cfg=dict(num_gpus=2, num_procs=1),
+    )
+]
--- a/configs/models/baichuan/hf_baichuan2_13b_chat.py
+++ b/configs/models/baichuan/hf_baichuan2_13b_chat.py
+from opencompass.models import HuggingFaceCausalLM
+_meta_template = dict(
+    round=[
+        dict(role='HUMAN', begin='<reserved_106>'),
+        dict(role='BOT', begin='<reserved_107>', generate=True),
+    ],
+)
+models = [
+    dict(
+        type=HuggingFaceCausalLM,
+        abbr='baichuan2-13b-chat-hf',
+        path="baichuan-inc/Baichuan2-13B-Chat",
+        tokenizer_path='baichuan-inc/Baichuan2-13B-Chat',
+        tokenizer_kwargs=dict(
+            padding_side='left',
+            truncation_side='left',
+            trust_remote_code=True,
+            use_fast=False,
+        ),
+        meta_template=_meta_template,
+        max_out_len=100,
+        max_seq_len=2048,
+        batch_size=8,
+        model_kwargs=dict(device_map='auto', trust_remote_code=True),
+        run_cfg=dict(num_gpus=2, num_procs=1),
+    )
+]
--- a/configs/models/baichuan/hf_baichuan2_7b_base.py
+++ b/configs/models/baichuan/hf_baichuan2_7b_base.py
+from opencompass.models import HuggingFaceCausalLM
+models = [
+    dict(
+        type=HuggingFaceCausalLM,
+        abbr='baichuan2-7b-base-hf',
+        path="baichuan-inc/Baichuan2-7B-Base",
+        tokenizer_path='baichuan-inc/Baichuan2-7B-Base',
+        tokenizer_kwargs=dict(
+            padding_side='left',
+            truncation_side='left',
+            trust_remote_code=True,
+            use_fast=False,
+        ),
+        max_out_len=100,
+        max_seq_len=2048,
+        batch_size=8,
+        model_kwargs=dict(device_map='auto', trust_remote_code=True),
+        run_cfg=dict(num_gpus=1, num_procs=1),
+    )
+]
--- a/configs/models/baichuan/hf_baichuan2_7b_chat.py
+++ b/configs/models/baichuan/hf_baichuan2_7b_chat.py
+from opencompass.models import HuggingFaceCausalLM
+_meta_template = dict(
+    round=[
+        dict(role='HUMAN', begin='<reserved_106>'),
+        dict(role='BOT', begin='<reserved_107>', generate=True),
+    ],
+)
+models = [
+    dict(
+        type=HuggingFaceCausalLM,
+        abbr='baichuan2-7b-chat-hf',
+        path="baichuan-inc/Baichuan2-7B-Chat",
+        tokenizer_path='baichuan-inc/Baichuan2-7B-Chat',
+        tokenizer_kwargs=dict(
+            padding_side='left',
+            truncation_side='left',
+            trust_remote_code=True,
+            use_fast=False,
+        ),
+        meta_template=_meta_template,
+        max_out_len=100,
+        max_seq_len=2048,
+        batch_size=8,
+        model_kwargs=dict(device_map='auto', trust_remote_code=True),
+        run_cfg=dict(num_gpus=1, num_procs=1),
+    )
+]
--- a/configs/models/hf_baichuan_13b_base.py
+++ b/configs/models/hf_baichuan_13b_base.py
--- a/configs/models/hf_baichuan_13b_chat.py
+++ b/configs/models/hf_baichuan_13b_chat.py
--- a/configs/models/hf_baichuan_7b.py
+++ b/configs/models/hf_baichuan_7b.py
--- a/configs/models/hf_chatglm2_6b.py
+++ b/configs/models/hf_chatglm2_6b.py
--- a/configs/models/hf_chatglm_6b.py
+++ b/configs/models/hf_chatglm_6b.py
--- a/configs/models/claude.py
+++ b/configs/models/claude.py
--- a/configs/models/claude2.py
+++ b/configs/models/claude2.py