[README]更新

b1580363 · laibao · aa61e330 · b1580363 · b1580363
Commit b1580363 authored Oct 15, 2024 by laibao
Hide whitespace changes
Inline Side-by-side

Showing with 8 additions and 4 deletions

README.md README.md +8 -4

doc/llava_network.png doc/llava_network.png +0 -0

No files found.
--- a/README.md
+++ b/README.md
@@ -5,18 +5,22 @@
 * @LastEditTime: 2024-09-30 08:30:01
 -->
-# Qwen1.5
+# llava
 ## 论文
-无
+Visual Instruction Tuning
+[2304.08485 (arxiv.org)](https://arxiv.org/pdf/2304.08485)
 ## 模型结构
-Qwen1.5是阿里云开源大型语言模型系列，是Qwen2.0的beta版本。相较于以往版本，本次更新着重提升了Chat模型与人类偏好的对齐程度，并且显著增强了模型的多语言处理能力。在序列长度方面，所有规模模型均已实现 32768 个tokens的上下文长度范围支持。同时，预训练 Base 模型的质量也有关键优化，有望在微调过程中带来更佳体验。
+LLaVA（大型语言和视觉助手）是一个开源的大型多模态模型，结合了视觉和语言能力。它通过将视觉编码器与语言模型 Vicuna 结合，实现了先进的视觉和语言理解，在多模态任务中表现优异，并在多个基准测试中（如 Science QA）设立了新的标准。LLaVA 以成本效益高的训练和高效扩展性著称，最近的更新着重提升了多模态推理能力，尤其是对高分辨率图像的理解。
+LLaVA 的最新进展包括支持动态高分辨率处理，以及多语言的零样本能力，如中文，展现了在非英语数据上未经特定微调的情况下也能保持出色的表现
 <div align=center>
-    <img src="./doc/qwen1.5.jpg"/>
+    <img src="./doc/llava_network.png"/>
 </div>
 ## 算法原理

--- a/doc/llava_network.png
+++ b/doc/llava_network.png