Explore GitLab
Discover projects, groups and snippets. Share your projects with others
-
-
-
Step-Video-TI2V 是一款基于文本驱动的图像到视频生成模型,拥有30B参数,能够根据文本和图像输入生成最长102帧的视频。
-
Step1X-Edit作为一种新的通用图像编辑算法,通过结合强大的多模态大语言模型和基于扩散的图像解码器,显著提高了图像编辑的性能。
-
-
-
-
-
-
-
YOLOE跨越多种开放Prompt机制实现了实时感知任何事物,不受限于预定义类别。
-
-
具身智能新时代!VLA迎来最强基础模型Magma:UI导航、机器人操作全能。
-
-
-
-
-
-
-