Commit 2927283f authored by wanglch's avatar wanglch
Browse files

Update README.md

parent c6b3ca7a
...@@ -4,9 +4,10 @@ ...@@ -4,9 +4,10 @@
## 论文 ## 论文
-[Small Language Model Meets with Reinforced Vision Vocabulary](https://arxiv.org/abs/2401.12503) - [Small Language Model Meets with Reinforced Vision Vocabulary](https://arxiv.org/abs/2401.12503)
## 模型结构 ## 模型结构
最近Vary的团队开发了一个更小版本的Vary模型——1.8B Vary-toy,与Vary相比,Vary-toy除了小之外,还优化了新视觉词表。解决了原Vary只用新视觉词表做pdf ocr的网络容量浪费,以及吃不到SAM预训练优势的问题。与Vary-toy同时发布的还有更强的视觉词表网络,其不仅能做pdf-level ocr,还能做通用视觉目标检测。Vary-toy在消费级显卡可训练、8G显存的老显卡可运行,依旧支持中英文。
<div align="center"> <div align="center">
<img src="./image/model.png"/> <img src="./image/model.png"/>
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment