README.md 3.59 KB
Newer Older
dengjb's avatar
dengjb committed
1
# RTMDet_mmcv
dengjb's avatar
dengjb committed
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
## 论文
`RTMDet: An Empirical Study of Designing Real-Time Object Detectors`<br>
[论文链接](https://arxiv.org/abs/2212.07784)
## 模型结构
RTMDet 将 CSPDarkNet 作为基线,并使用同样构建单元组成的 CSPPAFPN 进行多尺度的特征融合,最后将特征输入给不同的检测头,进行目标检测、实例分割和旋转框检测等任务
![模型结构](./resources/moel_struct.jpg)
## 算法原理
宏观架构与yolo系列没有太大的区别,主要增加了构建基本单元的特征提取能力以及弹错模型不同的组件件的计算效率和精度平衡
对构建单元进行了更新
![model](./resources/model.jpg)
![构建单元](./resources/模块改进.jpg)
## 环境配置
### Docker(方法一)

```
docker pull image.sourcefind.cn:5000/dcu/admin/base/pytorch:1.13.1-centos7.6-dtk-23.04.1-py38-latest
docker run -it -v /path/your_code_data/:/path/your_code_data/ --shm-size=32G --privileged=true --device=/dev/kfd --device=/dev/dri/ --group-add video --name docker_name imageID bash
cd /path/workspace/
dengjb's avatar
dengjb committed
20
pip install mmdet==3.2.0 -i https://mirrors.aliyun.com/pypi/simple/
dengjb's avatar
dengjb committed
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
```
### Dockerfile(方法二)
```
cd ./docker
docker build --no-cache -t mmdet:3.0 .
docker run -it -v /path/your_code_data/:/path/your_code_data/ --shm-size=32G --privileged=true --device=/dev/kfd --device=/dev/dri/ --group-add video --name docker_name imageID bash
cd /path/workspace/
```
### Anaconda(方法三)
1、关于本项目DCU显卡所需的特殊深度学习库可从光合开发者社区下载安装: https://developer.hpccube.com/tool/
```
DTK软件栈: dtk23.04.1
python: python3.8
torch: 1.13.1
torchvision: 0.14.1
mmcv: 2.0.0

```

Tips:以上dtk软件栈、python、torch、mmcv等DCU相关工具版本需要严格一一对应

2、其他非特殊库直接按照requirements.txt安装

```
cd workspace/
dengjb's avatar
dengjb committed
46
pip install mmdet==3.2.0 -i https://mirrors.aliyun.com/pypi/simple/
dengjb's avatar
dengjb committed
47
cd docker/
dengjb's avatar
dengjb committed
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
pip3 install -r requirements.txt
```

## 数据集
COCO2017(在网络良好的情况下,如果没有下载数据集,程序会默认在线下载数据集)

[训练数据](http://images.cocodataset.org/zips/train2017.zip)

[验证数据](http://images.cocodataset.org/zips/val2017.zip)

[测试数据](http://images.cocodataset.org/zips/test2017.zip)

[标签数据](https://github.com/ultralytics/yolov5/releases/download/v1.0/coco2017labels.zip)

数据集的目录结构如下:

```
├── images 
│   ├── train2017
│   ├── val2017
│   ├── test2017
├── labels
│   ├── train2017
│   ├── val2017
├── annotations
│   ├── instances_val2017.json
├── LICENSE
├── README.txt 
├── test-dev2017.txt
├── train2017.txt
├── val2017.txt

```

## 训练
dengjb's avatar
dengjb committed
83
- 数据集放置位置默认为当前目录下 data/
dengjb's avatar
dengjb committed
84
- 如需要变更数据集目录 请修改 configs/\_base_\/datasets/coco_detection.py 下的 data_root
dengjb's avatar
dengjb committed
85
86
87
```python
bash ./train.sh
```
dengjb's avatar
dengjb committed
88
89
90
## 推理
```python
# 官方推理代码
dengjb's avatar
dengjb committed
91
python demo/image_demo.py demo/demo.jpg ./configs/rtmdet/rtmdet_tiny_8xb32-300e_coco.py --weights rtmdet_tiny_8xb32-300e_coco_20220902_112414-78e30dcc.pth --device cuda
dengjb's avatar
dengjb committed
92
```
dengjb's avatar
dengjb committed
93
94
95
96
97
98
99
100
101
102
103
104
105
## result
![result](./resources/result.jpg)
## 精度
|  模型名称  | batchsize | amp混精 |  精度  |
|:------:|:---------:|:-----:|:----:|
|rtmdet-s|    256    |  off  | 44.5 |
|rtmdet-s|    256    |  on   | 44.5 |
## 应用场景
### 算法类别
`目标检测`
### 热点应用行业
`金融,交通,教育`
## 源码仓库及问题反馈
dengjb's avatar
dengjb committed
106
- https://developer.hpccube.com/codes/modelzoo/rtmdet_mmcv
dengjb's avatar
dengjb committed
107
## 参考资料
dengjb's avatar
dengjb committed
108
- https://github.com/open-mmlab/mmdetection/tree/v3.2.0