Explore GitLab
Discover projects, groups and snippets. Share your projects with others
-
DeepLabv3Plus是2025年医学图像分割领域最火的模型之一,结合了UNet的编码器-解码器结构和DeepLabv3的ASPP模块,适用于像素级图像分割任务
-
MiniCPM-V 2.6是是 MiniCPM-V 系列中最新、性能最佳的模型。仅 8B 参数,但却取得 20B 以下单图、多图、视频理解 3 SOTA 成绩,一举将端侧 AI 多模态能力拉升至全面对标 GPT-4V 水平。
-
-
美团开源模型龙猫,一个强大且高效的语言模型,拥有总计 5600 亿个参数,采用了创新的专家混合(MoE)架构。
-
-
-
Step-Video-T2V是一个目前最先进的文本到视频预训练模型,拥有300亿个参数,能够生成最长204帧的视频。
-
Qwen3-30B-A3B版本
-
Personal TTS,即个性化语音合成,以阿里的KAN-TTS框架实现
-
智谱 AI 推出的最新一代预训练模型 GLM-4 系列。
-
基于 Ovis-U1,Ovis-Image 是一个 7B 的文本到图像模型,专门针对高质量文本渲染进行了优化,设计用于在严格的计算约束下高效运行。
-
-
Qwen3Guard是阿里巴巴Qwen团队于2025年9月24日发布的人工智能安全审查模型系列。该模型基于Qwen3模型构建,主要用于提供实时高效的人工智能安全保障。
-
-
-
-
Source code of our ICML 2024 paper "Less is More: on the Over-Globalizing Problem in Graph Transformers"
-
migraphx inference demo of stablediffusion v2.1
-
Z-Image 是一个强大的、高效的图像生成模型。
-
Ovis2.5专为原生分辨率视觉感知和增强的多模态推理而设计,在图像推理、视频理解和接地基准测试中表现出领先的性能,展现了强大的通用多模态能力。