Explore GitLab
Discover projects, groups and snippets. Share your projects with others
-
-
-
-
AudioFly 是一个音频生成模型。它根据文本描述合成音效。该模型可以以 44.1 kHz 的采样率生成高质量音频。生成的音频与提示文本有很强的一致性。 AudioFly 采用了潜在扩散模型架构。该模型拥有 10 亿个参数,并在大量多样化的语料库上进行了训练。训练数据包括开源数据集,如 AudioSet、AudioCaps 和 TUT,以及专有的内部数据。该模型在单一事件和多事件场景中表现良好。
-
-
-
-
OpenMM is a toolkit for molecular simulation using high performance GPU code.
-
Kimi K2.5 作为一个原生多模态模型,提供了最先进的编码和视觉功能,以及自主智能体集群范式。
-
Gemma 4 模型旨在在每个尺寸级别上都达到前沿性能,覆盖从移动和边缘设备(E2B、E4B)到消费级 GPU 和工作站(26B A4B、31B)的多种部署场景。
-
-
-
Step 3.7 Flash 是一个拥有 1980 亿参数的稀疏混合专家(MoE)视觉语言模型,它将一个 1960 亿参数的语言主干网络与一个 18 亿参数的视觉编码器相结合,以实现原生图像理解。
-
-
-
-
-
-
原始仓库版本: https://github.com/OpenGVLab/DCNv4
4b848f7dd7da74ff03f7d278f902c6fd05b391b5