known_issues.rst 715 Bytes
Newer Older
xu rui's avatar
xu rui committed
1
2
3
4
5
6
7
8
9
10
11
12
13
已知问题
============

-  阅读顺序基于模型对可阅读内容在空间中的分布进行排序,在极端复杂的排版下可能会部分区域乱序
-  不支持竖排文字
-  目录和列表通过规则进行识别,少部分不常见的列表形式可能无法识别
-  标题只有一级,目前不支持标题分级
-  代码块在layout模型里还没有支持
-  漫画书、艺术图册、小学教材、习题尚不能很好解析
-  表格识别在复杂表格上可能会出现行/列识别错误
-  在小语种PDF上,OCR识别可能会出现字符不准确的情况(如拉丁文的重音符号、阿拉伯文易混淆字符等)
-  部分公式可能会无法在markdown中渲染