README.md 1.14 KB
Newer Older
zhanggezhong's avatar
zhanggezhong committed
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
# TVM 
## 模型介绍
使用深度学习编译器TVM对ResNet50网络模型进行推理及调优
## 模型结构
ResNet50网络中包含了49个卷积层、1个全连接层等
## 数据集及模型文件
模型文件下载地址:  "https://github.com/onnx/models/raw/main/vision/classification/resnet/model/resnet50-v2-7.onnx"
## 推理及自动调优
### 环境配置
拉取镜像:
    docker pull image.sourcefind.cn:5000/dcu/admin/base/custom:tvm-0.10_dtk-22.10_py38_centos-7.6
 
### 执行推理及调优
下载模型文件后执行以下命令进行推理测试及调优测试:

    python tune_resnet50-v2.py
    
        
## TVM版本
TVM-0.10
## 性能和准确率数据
使用DCUZ100加速卡执行推理,重复推理100次取平均性能

| 卡数 | batch size | 类型 | 性能 | 是否使用MIOpen | 是否使用tune |
| :------: | :------: | :------: | :------: |:------: | :------:|
| 1 | 1 | FP32 | 195 examples/second| 是  |否|
| 1 | 1 | FP32 | 177.83 examples/second | 否 | 否 |


## 参考
* [https://tvm.apache.org/docs/how_to/tune_with_autoscheduler/tune_network_cuda.html#sphx-glr-how-to-tune-with-autoscheduler-tune-network-cuda-py]()