# DataAnalysis 将大模型推理测试生成的excel数据文件,按照特定方式生成柱状图进行比较 配置文件data_config.json示例说明: ``` { "filter": { "并发数": [], "模型": [] }, "distinguish": ["模型", "卡类型", "卡数"], "group_by": [["并发数"], ["输入长度(tokens)", "输出长度(tokens)"]], "files": [ { "file": "test100.xlsx", "sheets": [], "column_mapping": { }, "column_replace": { } } ] } filter: 过滤条件,不设置或者为空则不过滤 distinguish: 选择输出文件的条件,例如["模型", "卡类型", "卡数"]则将相同的模型、卡类型和卡数的所有数据生成以个文件 group_by: 可以进行最多2重分组,每层一个图,第2层以不同柱状显示数据。如果命令行参数指定合并,则所有合成一个图,分组之间间隔开 files: 指定文件信息, 可以使用多个文件 file: 文件名 sheets: 可以指定处理的sheet,不指定则遍历所有 column_mapping: 列名重映射,用于处理多个文件时表头信息略有差异的情况 ``` ## 使用方法 ``` python3 plot_comparison.py --help usage: plot_comparison.py [-h] [--配置 配置] [--输出目录 输出目录] [--合并分组] 绘制模型性能对比图表 options: -h, --help show this help message and exit --配置 配置, -f 配置 数据配置文件路径 --输出目录 输出目录, -d 输出目录 输出图表目录 --合并分组, -m 将第一层分组合并到一张图中 ``` ##