Explore GitLab
Discover projects, groups and snippets. Share your projects with others
-
-
YOLO(You Only Look Once)是一种流行的对象检测和图像分割模型,由华盛顿大学的Joseph Redmon和Ali Farhadi开发。YOLO 于 2015 年推出,因其高速和准确性而迅速普及。
-
MiMo-V2.5 是一个原生全模态模型,具备强大的智能体(agentic)能力,通过统一架构支持文本、图像、视频和音频的理解。该模型基于 MiMo-V2-Flash 主干网络构建,并扩展了专用的视觉和音频编码器,在多模态感知、长上下文推理和智能体工作流方面表现出卓越性能。
-
Kimi K2.6 是一个开源的原生多模态智能体模型,在长周期编程、以编程驱动的设计、主动自主执行以及基于智能体集群的任务编排等实际能力方面取得了显著进展。
-
-
-
-
-
-
彻底开源预训练大模型,极简讲清原理,极简提供算法实现代码,让大家秒懂、秒实现,方便大家提出自研算法,让人类文明自由共享是终极目标。
-
Intern-S1 结合了强大的通用任务能力和在广泛科学任务上的顶尖表现,可与领先的闭源商业模型相媲美。
-
用DeepStream进行视频推理的应用示例。
-
AlignedReID是旷视科技Face++提出的一种行人重识别(Person Re-Identification)方法,首次在该任务上实现超越人类水平的性能,达到94.0%和96.1%的首位命中率(rank-1 accuracy)
-
Gemma 4 模型旨在在每个尺寸级别上都达到前沿性能,覆盖从移动和边缘设备(E2B、E4B)到消费级 GPU 和工作站(26B A4B、31B)的多种部署场景。
-
-
-