You need to sign in or sign up before continuing.
Explore GitLab
Discover projects, groups and snippets. Share your projects with others
-
-
Intern-S1 结合了强大的通用任务能力和在广泛科学任务上的顶尖表现,可与领先的闭源商业模型相媲美。
-
Gemma 4 模型旨在在每个尺寸级别上都达到前沿性能,覆盖从移动和边缘设备(E2B、E4B)到消费级 GPU 和工作站(26B A4B、31B)的多种部署场景。
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
triton server在DCU上的应用
-
vLLM 最初是为支持文本生成任务的大型语言模型而设计的。vLLM-Omni 是一个框架,它将 vLLM 的支持扩展到全模态模型推理和服务的领域。