Explore GitLab
Discover projects, groups and snippets. Share your projects with others
-
在生成首个音频片段时大幅提升响应速度,解决实时语音关键瓶颈,整体推理速度相比同规模模型提升3–5倍。
-
Qwen3嵌入模型系列是Qwen3家族最新的专有模型,专门为文本嵌入和排序任务而设计。
-
专为边缘设备和边缘计算场景而设计,支持高达128,000个 token 的上下文长度。
-
-
-
-
TGI inference framework for LLM
-
-
参数量仅为DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等全球顶尖模型,将快思考与慢思考集成进同一个模型。
-
使用ONNXRuntime推理框架对语音识别模型WeNet进行推理。
-
-
-
Step-Video-TI2V 是一款基于文本驱动的图像到视频生成模型,拥有30B参数,能够根据文本和图像输入生成最长102帧的视频。
-
Step1X-Edit作为一种新的通用图像编辑算法,通过结合强大的多模态大语言模型和基于扩散的图像解码器,显著提高了图像编辑的性能。
-
-
-
-
-
-