Explore GitLab
Discover projects, groups and snippets. Share your projects with others
-
-
-
Kimi-VL-A3B-Thinking 由月之暗面开源发布的多模态模型,在多模态推理和智能体能力方面表现突出。
-
deepseek开发的多模态图片问答模型
-
多模态视觉大模型
-
OFA在一个简单的seq2seq的学习框架中统一了不同的跨模态和单模态的任务,包括图像生成、视觉定位、图像说明、图像分类、语言模型等,提出一种统一的多模态预训练范式,以解决复杂的任务/模态需要特殊定制模型架构的问题。
-
-
GLM-4.5是一款专为智能体应用打造的基础模型,包含推理、代码、智能体的综合能力达到开源 SOTA的模型,在真实代码智能体的人工对比评测中,实测国内最佳
-
DeepSeek-V3.1 是一款支持 “思考模式” 与 “非思考模式” 双模式的混合模型。
-
-
-
-
Neural4D 2.0将3D AI的生成效果提升至“人工级水平”,算力需求暴降80%,DreamTech已开源其前期研究成果Neural4D 1.0(本项目)。
-
MinerU是一个功能强大的PDF文档内容提取工具,它利用了先进的PDF-Extract-Kit模型库,能够有效地从各种类型的文档中提取内容。
-
-
Leveraging Message Passing GNNs for High-Quality Power Flow Approximation.
-
深度探索研发的文生图多模态模型
-
-
Multilingual Code Generation Model