readme.md 7.19 KB
Newer Older
LDOUBLEV's avatar
LDOUBLEV committed
1

MissPenguin's avatar
MissPenguin committed
2
# 推理部署导航
LDOUBLEV's avatar
LDOUBLEV committed
3

MissPenguin's avatar
MissPenguin committed
4
5
## 1. 简介

MissPenguin's avatar
MissPenguin committed
6
飞桨除了基本的模型训练和预测,还提供了支持多端多平台的高性能推理部署工具。本文档提供了PaddleOCR中所有模型的推理部署导航PTDN(Paddle Train Deploy Navigation),方便用户查阅每种模型的推理部署打通情况,并可以进行一键测试。
LDOUBLEV's avatar
LDOUBLEV committed
7

MissPenguin's avatar
MissPenguin committed
8
<div align="center">
MissPenguin's avatar
MissPenguin committed
9
    <img src="docs/guide.png" width="1000">
MissPenguin's avatar
MissPenguin committed
10
</div>
LDOUBLEV's avatar
LDOUBLEV committed
11

MissPenguin's avatar
MissPenguin committed
12
13
## 2. 汇总信息

MissPenguin's avatar
MissPenguin committed
14
打通情况汇总如下,已填写的部分表示可以使用本工具进行一键测试,未填写的表示正在支持中。
LDOUBLEV's avatar
LDOUBLEV committed
15

MissPenguin's avatar
MissPenguin committed
16
**字段说明:**
MissPenguin's avatar
MissPenguin committed
17
- 基础训练预测:包括模型训练、Paddle Inference Python预测。
MissPenguin's avatar
MissPenguin committed
18
19
20
21
22
23
- 训练扩展:包括多机多卡、混合精度。
- 模型压缩:包括裁剪、离线/在线量化、蒸馏。
- 其他预测部署:包括Paddle Inference C++预测、Paddle Serving部署、Paddle-Lite部署等。

| 算法论文 | 模型名称 | 模型类型 | 基础训练预测 | 训练扩展 | 模型压缩 |  其他预测部署  |
| :--- | :--- |  :----:  | :--------: |  :----  |   :----  |   :----  |
MissPenguin's avatar
MissPenguin committed
24
25
| DB     |ch_ppocr_mobile_v2.0_det | 检测  | 支持 | 多机多卡 <br> 混合精度 | PACT量化 <br> 离线量化| Paddle Inference: C++ <br> Paddle Serving: Python, C++ <br> Paddle-Lite: <br> (1) ARM CPU(C++) |
| DB     |ch_ppocr_server_v2.0_det | 检测  | 支持 | 多机多卡 <br> 混合精度 | PACT量化 <br> 离线量化| Paddle Inference: C++ <br> Paddle Serving: Python, C++ <br> Paddle-Lite: <br> (1) ARM CPU(C++) |
MissPenguin's avatar
MissPenguin committed
26
| DB     |ch_PP-OCRv2_det          | 检测  |
MissPenguin's avatar
MissPenguin committed
27
28
| CRNN   |ch_ppocr_mobile_v2.0_rec | 识别  | 支持 | 多机多卡 <br> 混合精度 | PACT量化 <br> 离线量化| Paddle Inference: C++ <br> Paddle Serving: Python, C++ <br> Paddle-Lite: <br> (1) ARM CPU(C++) |
| CRNN   |ch_ppocr_server_v2.0_rec | 识别  | 支持 | 多机多卡 <br> 混合精度 | PACT量化 <br> 离线量化| Paddle Inference: C++ <br> Paddle Serving: Python, C++ <br> Paddle-Lite: <br> (1) ARM CPU(C++) |
MissPenguin's avatar
MissPenguin committed
29
| CRNN   |ch_PP-OCRv2_rec          | 识别  |
MissPenguin's avatar
MissPenguin committed
30
31
32
| PP-OCR |ch_ppocr_mobile_v2.0 | 检测+识别  | 支持 | 多机多卡 <br> 混合精度 | PACT量化 <br> 离线量化| Paddle Inference: C++ <br> Paddle Serving: Python, C++ <br> Paddle-Lite: <br> (1) ARM CPU(C++) |
| PP-OCR |ch_ppocr_server_v2.0 | 检测+识别  | 支持 | 多机多卡 <br> 混合精度 | PACT量化 <br> 离线量化| Paddle Inference: C++ <br> Paddle Serving: Python, C++ <br> Paddle-Lite: <br> (1) ARM CPU(C++) |
|PP-OCRv2|ch_PP-OCRv2 | 检测+识别  | 支持 | 多机多卡 <br> 混合精度 | PACT量化 <br> 离线量化| Paddle Inference: C++ <br> Paddle Serving: Python, C++ <br> Paddle-Lite: <br> (1) ARM CPU(C++) |
MissPenguin's avatar
MissPenguin committed
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
| DB     |det_mv3_db_v2.0                | 检测  |
| DB     |det_r50_vd_db_v2.0             | 检测  |
| EAST   |det_mv3_east_v2.0              | 检测  |
| EAST   |det_r50_vd_east_v2.0           | 检测  |
| PSENet |det_mv3_pse_v2.0               | 检测  |
| PSENet |det_r50_vd_pse_v2.0            | 检测  |
| SAST   |det_r50_vd_sast_totaltext_v2.0 | 检测  |
| Rosetta|rec_mv3_none_none_ctc_v2.0     | 识别  |
| Rosetta|rec_r34_vd_none_none_ctc_v2.0  | 识别  |
| CRNN   |rec_mv3_none_bilstm_ctc_v2.0   | 识别  |
| CRNN   |rec_r34_vd_none_bilstm_ctc_v2.0| 识别  |
| StarNet|rec_mv3_tps_bilstm_ctc_v2.0    | 识别  |
| StarNet|rec_r34_vd_tps_bilstm_ctc_v2.0 | 识别  |
| RARE   |rec_mv3_tps_bilstm_att_v2.0    | 识别  |
| RARE   |rec_r34_vd_tps_bilstm_att_v2.0 | 识别  |
| SRN    |rec_r50fpn_vd_none_srn         | 识别  |
| NRTR   |rec_mtb_nrtr                   | 识别  |
| SAR    |rec_r31_sar                    | 识别  |
| PGNet  |rec_r34_vd_none_none_ctc_v2.0  | 端到端|
MissPenguin's avatar
MissPenguin committed
52
53


MissPenguin's avatar
MissPenguin committed
54

MissPenguin's avatar
MissPenguin committed
55
## 3. 一键测试工具使用
MissPenguin's avatar
MissPenguin committed
56
### 目录介绍
LDOUBLEV's avatar
LDOUBLEV committed
57

MissPenguin's avatar
MissPenguin committed
58
```shell
MissPenguin's avatar
MissPenguin committed
59
PTDN/
MissPenguin's avatar
MissPenguin committed
60
61
62
63
64
65
66
67
68
69
70
71
├── configs/  # 配置文件目录
	├── det_mv3_db.yml               # 测试mobile版ppocr检测模型训练的yml文件
	├── det_r50_vd_db.yml            # 测试server版ppocr检测模型训练的yml文件
	├── rec_icdar15_r34_train.yml    # 测试server版ppocr识别模型训练的yml文件
	├── ppocr_sys_mobile_params.txt     # 测试mobile版ppocr检测+识别模型串联的参数配置文件
	├── ppocr_det_mobile_params.txt     # 测试mobile版ppocr检测模型的参数配置文件
	├── ppocr_rec_mobile_params.txt     # 测试mobile版ppocr识别模型的参数配置文件
	├── ppocr_sys_server_params.txt     # 测试server版ppocr检测+识别模型串联的参数配置文件
	├── ppocr_det_server_params.txt     # 测试server版ppocr检测模型的参数配置文件
	├── ppocr_rec_server_params.txt     # 测试server版ppocr识别模型的参数配置文件
	├── ...                                
├── results/   # 预先保存的预测结果,用于和实际预测结果进行精读比对
MissPenguin's avatar
MissPenguin committed
72
73
74
75
	├── python_ppocr_det_mobile_results_fp32.txt           # 预存的mobile版ppocr检测模型python预测fp32精度的结果
	├── python_ppocr_det_mobile_results_fp16.txt           # 预存的mobile版ppocr检测模型python预测fp16精度的结果
	├── cpp_ppocr_det_mobile_results_fp32.txt       # 预存的mobile版ppocr检测模型c++预测的fp32精度的结果
	├── cpp_ppocr_det_mobile_results_fp16.txt       # 预存的mobile版ppocr检测模型c++预测的fp16精度的结果
MissPenguin's avatar
MissPenguin committed
76
	├── ...
MissPenguin's avatar
MissPenguin committed
77
78
79
80
81
82
83
├── prepare.sh                        # 完成test_*.sh运行所需要的数据和模型下载
├── test_train_inference_python.sh    # 测试python训练预测的主程序
├── test_inference_cpp.sh             # 测试c++预测的主程序
├── test_serving.sh                   # 测试serving部署预测的主程序
├── test_lite.sh                      # 测试lite部署预测的主程序
├── compare_results.py                # 用于对比log中的预测结果与results中的预存结果精度误差是否在限定范围内
└── readme.md                         # 使用文档
MissPenguin's avatar
MissPenguin committed
84
```
LDOUBLEV's avatar
LDOUBLEV committed
85

MissPenguin's avatar
MissPenguin committed
86
### 测试流程
MissPenguin's avatar
MissPenguin committed
87
88
89
90
使用本工具,可以测试不同功能的支持情况,以及预测结果是否对齐,测试流程如下:
<div align="center">
    <img src="docs/test.png" width="800">
</div>
MissPenguin's avatar
MissPenguin committed
91

MissPenguin's avatar
MissPenguin committed
92
93
1. 运行prepare.sh准备测试所需数据和模型;
2. 运行要测试的功能对应的测试脚本`test_*.sh`,产出log,由log可以看到不同配置是否运行成功;
MissPenguin's avatar
MissPenguin committed
94
3.`compare_results.py`对比log中的预测结果和预存在results目录下的结果,判断预测精度是否符合预期(在误差范围内)。
DanielYang's avatar
DanielYang committed
95

MissPenguin's avatar
MissPenguin committed
96
其中,有4个测试主程序,功能如下:
MissPenguin's avatar
MissPenguin committed
97
98
- `test_train_inference_python.sh`:测试基于Python的模型训练、评估、推理等基本功能,包括裁剪、量化、蒸馏。
- `test_inference_cpp.sh`:测试基于C++的模型推理。
MissPenguin's avatar
MissPenguin committed
99
100
- `test_serving.sh`:测试基于Paddle Serving的服务化部署功能。
- `test_lite.sh`:测试基于Paddle-Lite的端侧预测部署功能。
DanielYang's avatar
DanielYang committed
101

MissPenguin's avatar
fix  
MissPenguin committed
102
各功能测试中涉及混合精度、裁剪、量化等训练相关,及mkldnn、Tensorrt等多种预测相关参数配置,请点击下方相应链接了解更多细节和使用教程:  
MissPenguin's avatar
MissPenguin committed
103
104
105
106
[test_train_inference_python 使用](docs/test_train_inference_python.md)  
[test_inference_cpp 使用](docs/test_inference_cpp.md)  
[test_serving 使用](docs/test_serving.md)  
[test_lite 使用](docs/test_lite.md)