README.md 1.34 KB
Newer Older
yanke_chen's avatar
yanke_chen committed
1
# DataAnalysis
sharkgene@qq.com's avatar
sharkgene@qq.com committed
2
将大模型推理测试生成的excel数据文件,按照特定方式生成柱状图进行比较
yanke_chen's avatar
yanke_chen committed
3

sharkgene@qq.com's avatar
sharkgene@qq.com committed
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
配置文件data_config.json示例说明:
{
  "filter": {
    "并发数": [],
    "模型": []

  },
  "distinguish": ["模型", "卡类型", "卡数"],
  "group_by": [["并发数"], ["输入长度(tokens)", "输出长度(tokens)"]],
  "files": [
    {
      "file": "test100.xlsx",
      "sheets": [],
      "column_mapping": {
      },
      "column_replace": {
      }
    }
  ]
}

filter: 过滤条件,不设置或者为空则不过滤
distinguish: 选择输出文件的条件,例如["模型", "卡类型", "卡数"]则将相同的模型、卡类型和卡数的所有数据生成以个文件
group_by: 可以进行最多2重分组,每层一个图,第2层以不同柱状显示数据。如果命令行参数指定合并,则所有合成一个图,分组之间间隔开
files: 指定文件信息

## 使用方法
python3 plot_comparison.py --help
usage: plot_comparison.py [-h] [--配置 配置] [--输出目录 输出目录] [--合并分组]

绘制模型性能对比图表

options:
  -h, --help            show this help message and exit
  --配置 配置, -f 配置        数据配置文件路径
  --输出目录 输出目录, -d 输出目录  输出图表目录
  --合并分组, -m            将第一层分组合并到一张图中

##