Explore GitLab
Discover projects, groups and snippets. Share your projects with others
-
chatglm2-6b的推理
-
-
-
Granite-speech-3.3系列模型是一款小巧且高效的语音语言模型,专为自动语音识别(ASR)和自动语音翻译(AST)而设计。
-
-
MiniCPM-V 2.6是是 MiniCPM-V 系列中最新、性能最佳的模型。仅 8B 参数,但却取得 20B 以下单图、多图、视频理解 3 SOTA 成绩,一举将端侧 AI 多模态能力拉升至全面对标 GPT-4V 水平。
-
-
DiffusionDet: Diffusion Model for Object Detection
-
-
-
Kimi-VL-A3B-Thinking 由月之暗面开源发布的多模态模型,在多模态推理和智能体能力方面表现突出。
-
deepseek开发的多模态图片问答模型
-
多模态视觉大模型
-
OFA在一个简单的seq2seq的学习框架中统一了不同的跨模态和单模态的任务,包括图像生成、视觉定位、图像说明、图像分类、语言模型等,提出一种统一的多模态预训练范式,以解决复杂的任务/模态需要特殊定制模型架构的问题。
-
-
GLM-4.5是一款专为智能体应用打造的基础模型,包含推理、代码、智能体的综合能力达到开源 SOTA的模型,在真实代码智能体的人工对比评测中,实测国内最佳
-
DeepSeek-V3.1 是一款支持 “思考模式” 与 “非思考模式” 双模式的混合模型。
-
-