Skip to content
GitLab
Menu
Projects
Groups
Snippets
Loading...
Help
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in / Register
Toggle navigation
Menu
Open sidebar
ModelZoo
textmonkey_pytorch
Commits
065fddcd
Unverified
Commit
065fddcd
authored
Dec 16, 2023
by
ShuoZhang2003
Committed by
GitHub
Dec 16, 2023
Browse files
Update README_cn.md
parent
f8bbadab
Changes
1
Hide whitespace changes
Inline
Side-by-side
Showing
1 changed file
with
1 addition
and
0 deletions
+1
-0
README_cn.md
README_cn.md
+1
-0
No files found.
README_cn.md
View file @
065fddcd
...
@@ -27,6 +27,7 @@ Zhang Li*, Biao Yang*, Qiang Liu, Zhiyin Ma, Shuo Zhang, Jingxu Yang, Yabo Sun,
...
@@ -27,6 +27,7 @@ Zhang Li*, Biao Yang*, Qiang Liu, Zhiyin Ma, Shuo Zhang, Jingxu Yang, Yabo Sun,
**Monkey**
引入了一种高效的训练方法,可以有效地将输入分辨率提高到 896 x 1344 ,同时不需要从开始进行预训练。为了弥合简单的文本描述和高输入分辨率之间的差距,Monkey 还提出了一种多级描述生成方法,该方法自动提供丰富的信息,可以指导模型学习场景和对象之间的关联。通过这两种设计的协同作用,Monkey 在多个基准测试中取得了优异的结果。与各种多模态大模型(包括 GPT4V)相比,Monkey 通过关注文本信息并捕获图像中的精细细节,在图像字幕方面表现出了良好的性能;高输入分辨率还可以使模型在具有密集文本的文档图像中展现出出色的性能。
**Monkey**
引入了一种高效的训练方法,可以有效地将输入分辨率提高到 896 x 1344 ,同时不需要从开始进行预训练。为了弥合简单的文本描述和高输入分辨率之间的差距,Monkey 还提出了一种多级描述生成方法,该方法自动提供丰富的信息,可以指导模型学习场景和对象之间的关联。通过这两种设计的协同作用,Monkey 在多个基准测试中取得了优异的结果。与各种多模态大模型(包括 GPT4V)相比,Monkey 通过关注文本信息并捕获图像中的精细细节,在图像字幕方面表现出了良好的性能;高输入分辨率还可以使模型在具有密集文本的文档图像中展现出出色的性能。
## 新闻
## 新闻
*
```2023.12.16```
🚀🚀🚀 Monkey 可以使用 8 NVIDIA 3090 GPUs 进行训练。详见
[
训练
](
#训练
)
。
*
```2023.11.25```
🚀🚀🚀 Monkey
[
对话演示
](
http://27.18.7.151:7681/
)
发布。
*
```2023.11.25```
🚀🚀🚀 Monkey
[
对话演示
](
http://27.18.7.151:7681/
)
发布。
*
```2023.11.06```
🚀🚀🚀 Monkey
[
论文
](
https://arxiv.org/abs/2311.06607
)
发布。
*
```2023.11.06```
🚀🚀🚀 Monkey
[
论文
](
https://arxiv.org/abs/2311.06607
)
发布。
...
...
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
.
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment