Commit d8d9d716 authored by zhanggezhong's avatar zhanggezhong
Browse files

Update README.md

parent dd462c30
...@@ -4,10 +4,12 @@ ...@@ -4,10 +4,12 @@
## 模型结构 ## 模型结构
ResNet50网络中包含了49个卷积层、1个全连接层等 ResNet50网络中包含了49个卷积层、1个全连接层等
## 数据集及模型文件 ## 数据集及模型文件
模型文件下载地址: "https://github.com/onnx/models/raw/main/vision/classification/resnet/model/resnet50-v2-7.onnx" 模型文件下载地址:
"https://github.com/onnx/models/raw/main/vision/classification/resnet/model/resnet50-v2-7.onnx"
## 推理及自动调优 ## 推理及自动调优
### 环境配置 ### 环境配置
拉取镜像: 拉取镜像:
docker pull image.sourcefind.cn:5000/dcu/admin/base/custom:tvm-0.10_dtk-22.10_py38_centos-7.6 docker pull image.sourcefind.cn:5000/dcu/admin/base/custom:tvm-0.10_dtk-22.10_py38_centos-7.6
### 执行推理及调优 ### 执行推理及调优
...@@ -17,14 +19,15 @@ ResNet50网络中包含了49个卷积层、1个全连接层等 ...@@ -17,14 +19,15 @@ ResNet50网络中包含了49个卷积层、1个全连接层等
## TVM版本 ## TVM版本
TVM-0.10 TVM-0.10
## 性能和准确率数据 ## 性能和准确率数据
使用DCUZ100加速卡执行推理,重复推理100次取平均性能 使用DCUZ100加速卡执行推理,重复推理100次取平均性能.注:使用TVM tune的次数为200次若要达到最优效果最少设置20000次的tune。
| 卡数 | batch size | 类型 | 性能 | 是否使用MIOpen | 是否使用tune | | 卡数 | batch size | 类型 | 性能 | 是否使用MIOpen | 是否使用tune |
| :------: | :------: | :------: | :------: |:------: | :------:| | :------: | :------: | :------: | :------: |:------: | :------:|
| 1 | 1 | FP32 | 195 examples/second| 是 || | 1 | 1 | FP32 | 202.50 examples/second | 是 ||
| 1 | 1 | FP32 | 177.83 examples/second | 否 | 否 | | 1 | 1 | FP32 | 177.83 examples/second | 否 | 否 |
| 1 | 1 | FP32 | 190.62 examples/second | 否 | 是 |
## 参考 ## 参考
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment