Skip to content
GitLab
Menu
Projects
Groups
Snippets
Loading...
Help
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in / Register
Toggle navigation
Menu
Open sidebar
ModelZoo
PaddleOCR-VL-1.5_paddle
Commits
8074a2dc
Commit
8074a2dc
authored
Jan 30, 2026
by
chenych
Browse files
Update README.
parent
270306ba
Changes
1
Hide whitespace changes
Inline
Side-by-side
Showing
1 changed file
with
3 additions
and
2 deletions
+3
-2
README.md
README.md
+3
-2
No files found.
README.md
View file @
8074a2dc
...
@@ -5,7 +5,8 @@
...
@@ -5,7 +5,8 @@
## 模型简介
## 模型简介
PaddleOCR-VL-1.5 是 PaddleOCR-VL 的下一代先进模型,在 OmniDocBench v1.5 基准上实现了 94.5% 的全新 SOTA(当前最优)准确率。 为严格评估模型在真实世界物理失真(包括扫描伪影、倾斜、扭曲、屏幕拍摄和光照变化)下的鲁棒性,我们提出了 Real5-OmniDocBench 基准。实验结果表明,该增强模型在新构建的基准上达到了 SOTA 性能。此外,我们在保持模型为 0.9B 超紧凑视觉语言模型(VLM)并具备高效率的同时,进一步扩展了其能力,新增了印章识别和文本检测任务。
PaddleOCR-VL-1.5 是 PaddleOCR-VL 的下一代先进模型,在 OmniDocBench v1.5 基准上实现了 94.5% 的全新 SOTA(当前最优)准确率。 为严格评估模型在真实世界物理失真(包括扫描伪影、倾斜、扭曲、屏幕拍摄和光照变化)下的鲁棒性,我们提出了 Real5-OmniDocBench 基准。实验结果表明,该增强模型在新构建的基准上达到了 SOTA 性能。此外,我们在保持模型为 0.9B 超紧凑视觉语言模型(VLM)并具备高效率的同时,进一步扩展了其能力,新增了印章识别和文本检测任务。
PaddleOCR-VL-1.5 的核心能力
PaddleOCR-VL-1.5 的核心能力:
1. 参数量仅为 0.9B,PaddleOCR-VL-1.5 在 OmniDocBench v1.5 上达到 94.5% 的准确率,超越了先前的 SOTA 模型 PaddleOCR-VL。在表格、公式和文本识别方面均取得显著提升。
1. 参数量仅为 0.9B,PaddleOCR-VL-1.5 在 OmniDocBench v1.5 上达到 94.5% 的准确率,超越了先前的 SOTA 模型 PaddleOCR-VL。在表格、公式和文本识别方面均取得显著提升。
2. 通过支持不规则形状定位,引入了一种创新的文档解析方法,可在倾斜和扭曲的文档条件下实现精确的多边形检测。在五类真实场景(扫描、倾斜、扭曲、屏幕拍摄和光照变化)下的评测中,其性能均优于主流开源及闭源模型。
2. 通过支持不规则形状定位,引入了一种创新的文档解析方法,可在倾斜和扭曲的文档条件下实现精确的多边形检测。在五类真实场景(扫描、倾斜、扭曲、屏幕拍摄和光照变化)下的评测中,其性能均优于主流开源及闭源模型。
...
@@ -104,7 +105,7 @@ DCU与GPU精度一致,推理框架:paddle。
...
@@ -104,7 +105,7 @@ DCU与GPU精度一致,推理框架:paddle。
## 预训练权重
## 预训练权重
| 模型名称 | 权重大小 | DCU型号 | 最低卡数需求 |下载地址|
| 模型名称 | 权重大小 | DCU型号 | 最低卡数需求 |下载地址|
|:-----:|:----------:|:----------:|:---------------------:|:----------:|
|:-----:|:----------:|:----------:|:---------------------:|:----------:|
| PaddleOCR-VL-1.5 |
1
B | K100AI | 1 |
[
Modelscope
](
https://modelscope.cn/models/PaddlePaddle/PaddleOCR-VL-1.5
)
|
| PaddleOCR-VL-1.5 |
0.9
B | K100AI | 1 |
[
Modelscope
](
https://modelscope.cn/models/PaddlePaddle/PaddleOCR-VL-1.5
)
|
## 源码仓库及问题反馈
## 源码仓库及问题反馈
-
https://developer.sourcefind.cn/codes/modelzoo/paddleocr-vl-1.5_paddle
-
https://developer.sourcefind.cn/codes/modelzoo/paddleocr-vl-1.5_paddle
...
...
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
.
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment