Explore GitLab
Discover projects, groups and snippets. Share your projects with others
-
triton server在DCU上的应用
-
vLLM 最初是为支持文本生成任务的大型语言模型而设计的。vLLM-Omni 是一个框架,它将 vLLM 的支持扩展到全模态模型推理和服务的领域。
-
-
DCU进程监控器,记录使用GPU、DCU的进程信息,为将来的效能分析提供基础数据
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
LongCat-Video模型,一个13.6B的适配生成模型,在多个方向都有不俗的表现,包括文生视频,图生视频等等