Skip to content
GitLab
Menu
Projects
Groups
Snippets
Loading...
Help
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in / Register
Toggle navigation
Menu
Open sidebar
wangsen
paddle_dbnet
Commits
69427021
Commit
69427021
authored
May 06, 2022
by
MissPenguin
Browse files
update doc
parent
d9c3a4b9
Changes
1
Hide whitespace changes
Inline
Side-by-side
Showing
1 changed file
with
6 additions
and
3 deletions
+6
-3
doc/doc_ch/PP-OCRv3_introduction.md
doc/doc_ch/PP-OCRv3_introduction.md
+6
-3
No files found.
doc/doc_ch/PP-OCRv3_introduction.md
View file @
69427021
...
...
@@ -75,7 +75,7 @@ LK-PAN(Large Kernel PAN)是一个具有更大感受野的轻量级[PAN](https://
**(2)DML(Deep Mutual Learning)蒸馏进一步提升teacher模型精度。**
[
DML
](
https://arxiv.org/abs/1706.00384
)
互学习蒸馏方法,通过两个结构相同的模型互相学习,相比于传统的教师模型监督学生模型的蒸馏方法,DML 摆脱了对大的
Teacher
模型的依赖,蒸馏训练的流程更加简单。在PP-OCRv3的检测模型训练中,使用DML蒸馏策略进一步提升教师模型的精度,并使用ResNet50作为Backbone。DML策略将
teacher
模型的
h
mean从85%进一步提升至86%。
[
DML
](
https://arxiv.org/abs/1706.00384
)
互学习蒸馏方法,通过两个结构相同的模型互相学习,相比于传统的教师模型监督学生模型的蒸馏方法,DML 摆脱了对大的
教师
模型的依赖,蒸馏训练的流程更加简单。在PP-OCRv3的检测模型训练中,使用DML蒸馏策略进一步提升教师模型的精度,并使用ResNet50作为Backbone。DML策略将
教师
模型的
H
mean从85%进一步提升至86%。
教师模型DML训练流程图如下:
...
...
@@ -173,7 +173,7 @@ PP-OCRv3将base模型从CRNN替换成了[SVTR](https://arxiv.org/abs/2205.00159)
</div>
**(4)TextRotNet
无
监督训练优化预训练模型。**
**(4)TextRotNet
自
监督训练优化预训练模型。**
为了充分利用自然场景中的大量无标注文本数据,PP-OCRv3参考论文
[
STR-Fewer-Labels
](
https://github.com/ku21fan/STR-Fewer-Labels
)
,设计TextRotNet自监督任务,对识别图像进行旋转并预测其旋转角度,同时结合中文场景文字识别任务的特点,在训练时适当调整图像的尺寸,添加文本识别数据增广,最终产出针对文本识别任务的PP-LCNet预训练模型,帮助识别模型精度进一步提升0.6%。TextRotNet训练流程如下图所示:
...
...
@@ -182,7 +182,7 @@ PP-OCRv3将base模型从CRNN替换成了[SVTR](https://arxiv.org/abs/2205.00159)
</div>
**(5)UIM(Unlabeled Images Mining)无标
签
数据挖掘。**
**(5)UIM(Unlabeled Images Mining)无标
注
数据挖掘
策略
。**
为更直接利用自然场景中包含大量无标注数据,使用PP-OCRv2检测模型以及SVTR_tiny识别模型对百度开源的40W
[
LSVT弱标注数据集
](
https://ai.baidu.com/broad/introduction?dataset=lsvt
)
进行检测与识别,并筛选出识别得分大于0.95的文本,共81W文本行数据,将其补充到训练数据中,最终进一步提升模型精度1.0%。
...
...
@@ -203,6 +203,9 @@ PP-OCRv3将base模型从CRNN替换成了[SVTR](https://arxiv.org/abs/2205.00159)
| PP-OCRv2 | 57.6% | 11.6 | 330 | 111 |
| PP-OCRv3 | 62.9% | 15.6 | 331 | 86.64 |
测试环境:CPU型号为Intel Gold 6148,CPU预测时开启MKLDNN加速。
除了更新中文模型,本次升级也同步优化了英文数字模型,端到端效果提升11%,如下表所示:
| Model | Recall | Precision | Hmean |
...
...
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
.
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment