Explore GitLab
Discover projects, groups and snippets. Share your projects with others
-
yi-6b和yi-34b推理
-
-
金融对话大模型
-
X-Decoder: Generalized Decoding for Pixel, Image, and Language
-
wav2vec由facebook AI Research团队提出,效仿nlp上的word2vec,是语音的一种通用特征提取器。
-
-
-
VITA能够处理视频、图像、文本和音频,具备先进的多模态交互体验,无需使用唤醒词或按钮即可被激活。
-
-
-
基于MIGraphX框架的Vision Transformer推理示例
-
-
基于Transformer架构直接处理完成图像识别任务
-
基于TVM框架的视频类推理示例
-
-
-
多模态OC大模型
-
多模态OCR模型
-
类GPT风格的以文生图模型