Skip to content
GitLab
Menu
Projects
Groups
Snippets
Loading...
Help
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in / Register
Toggle navigation
Menu
Open sidebar
laibao
llava_vllm
Commits
b1580363
Commit
b1580363
authored
Oct 15, 2024
by
laibao
Browse files
[README]更新
parent
aa61e330
Changes
2
Hide whitespace changes
Inline
Side-by-side
Showing
2 changed files
with
8 additions
and
4 deletions
+8
-4
README.md
README.md
+8
-4
doc/llava_network.png
doc/llava_network.png
+0
-0
No files found.
README.md
View file @
b1580363
...
@@ -5,18 +5,22 @@
...
@@ -5,18 +5,22 @@
*
@LastEditTime: 2024-09-30 08:30:01
*
@LastEditTime: 2024-09-30 08:30:01
-->
-->
#
Qwen1.5
#
llava
## 论文
## 论文
无
Visual Instruction Tuning
[
2304.08485 (arxiv.org)
](
https://arxiv.org/pdf/2304.08485
)
## 模型结构
## 模型结构
Qwen1.5是阿里云开源大型语言模型系列,是Qwen2.0的beta版本。相较于以往版本,本次更新着重提升了Chat模型与人类偏好的对齐程度,并且显著增强了模型的多语言处理能力。在序列长度方面,所有规模模型均已实现 32768 个tokens的上下文长度范围支持。同时,预训练 Base 模型的质量也有关键优化,有望在微调过程中带来更佳体验。
LLaVA(大型语言和视觉助手)是一个开源的大型多模态模型,结合了视觉和语言能力。它通过将视觉编码器与语言模型 Vicuna 结合,实现了先进的视觉和语言理解,在多模态任务中表现优异,并在多个基准测试中(如 Science QA)设立了新的标准。LLaVA 以成本效益高的训练和高效扩展性著称,最近的更新着重提升了多模态推理能力,尤其是对高分辨率图像的理解。
LLaVA 的最新进展包括支持动态高分辨率处理,以及多语言的零样本能力,如中文,展现了在非英语数据上未经特定微调的情况下也能保持出色的表现
<div
align=
center
>
<div
align=
center
>
<img
src=
"./doc/
qwen1.5.jp
g"
/>
<img
src=
"./doc/
llava_network.pn
g"
/>
</div>
</div>
## 算法原理
## 算法原理
...
...
doc/llava_network.png
0 → 100644
View file @
b1580363
166 KB
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
.
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment