Commit 8074a2dc authored by chenych's avatar chenych
Browse files

Update README.

parent 270306ba
...@@ -5,7 +5,8 @@ ...@@ -5,7 +5,8 @@
## 模型简介 ## 模型简介
PaddleOCR-VL-1.5 是 PaddleOCR-VL 的下一代先进模型,在 OmniDocBench v1.5 基准上实现了 94.5% 的全新 SOTA(当前最优)准确率。 为严格评估模型在真实世界物理失真(包括扫描伪影、倾斜、扭曲、屏幕拍摄和光照变化)下的鲁棒性,我们提出了 Real5-OmniDocBench 基准。实验结果表明,该增强模型在新构建的基准上达到了 SOTA 性能。此外,我们在保持模型为 0.9B 超紧凑视觉语言模型(VLM)并具备高效率的同时,进一步扩展了其能力,新增了印章识别和文本检测任务。 PaddleOCR-VL-1.5 是 PaddleOCR-VL 的下一代先进模型,在 OmniDocBench v1.5 基准上实现了 94.5% 的全新 SOTA(当前最优)准确率。 为严格评估模型在真实世界物理失真(包括扫描伪影、倾斜、扭曲、屏幕拍摄和光照变化)下的鲁棒性,我们提出了 Real5-OmniDocBench 基准。实验结果表明,该增强模型在新构建的基准上达到了 SOTA 性能。此外,我们在保持模型为 0.9B 超紧凑视觉语言模型(VLM)并具备高效率的同时,进一步扩展了其能力,新增了印章识别和文本检测任务。
PaddleOCR-VL-1.5 的核心能力 PaddleOCR-VL-1.5 的核心能力:
1. 参数量仅为 0.9B,PaddleOCR-VL-1.5 在 OmniDocBench v1.5 上达到 94.5% 的准确率,超越了先前的 SOTA 模型 PaddleOCR-VL。在表格、公式和文本识别方面均取得显著提升。 1. 参数量仅为 0.9B,PaddleOCR-VL-1.5 在 OmniDocBench v1.5 上达到 94.5% 的准确率,超越了先前的 SOTA 模型 PaddleOCR-VL。在表格、公式和文本识别方面均取得显著提升。
2. 通过支持不规则形状定位,引入了一种创新的文档解析方法,可在倾斜和扭曲的文档条件下实现精确的多边形检测。在五类真实场景(扫描、倾斜、扭曲、屏幕拍摄和光照变化)下的评测中,其性能均优于主流开源及闭源模型。 2. 通过支持不规则形状定位,引入了一种创新的文档解析方法,可在倾斜和扭曲的文档条件下实现精确的多边形检测。在五类真实场景(扫描、倾斜、扭曲、屏幕拍摄和光照变化)下的评测中,其性能均优于主流开源及闭源模型。
...@@ -104,7 +105,7 @@ DCU与GPU精度一致,推理框架:paddle。 ...@@ -104,7 +105,7 @@ DCU与GPU精度一致,推理框架:paddle。
## 预训练权重 ## 预训练权重
| 模型名称 | 权重大小 | DCU型号 | 最低卡数需求 |下载地址| | 模型名称 | 权重大小 | DCU型号 | 最低卡数需求 |下载地址|
|:-----:|:----------:|:----------:|:---------------------:|:----------:| |:-----:|:----------:|:----------:|:---------------------:|:----------:|
| PaddleOCR-VL-1.5 | 1B | K100AI | 1 | [Modelscope](https://modelscope.cn/models/PaddlePaddle/PaddleOCR-VL-1.5) | | PaddleOCR-VL-1.5 | 0.9B | K100AI | 1 | [Modelscope](https://modelscope.cn/models/PaddlePaddle/PaddleOCR-VL-1.5) |
## 源码仓库及问题反馈 ## 源码仓库及问题反馈
- https://developer.sourcefind.cn/codes/modelzoo/paddleocr-vl-1.5_paddle - https://developer.sourcefind.cn/codes/modelzoo/paddleocr-vl-1.5_paddle
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment