# chatglm-6b 性能测试 为了测试模型的推理性能,请先下载huggingface上的chatglm-6b模型,然后将其中的`modeling_chatglm.py`替换为本目录下的同名脚本,运行`python test_latency.py`即可进行测试,测试结束会打印出模型推理性能结果。