Explore GitLab
Discover projects, groups and snippets. Share your projects with others
-
Pix2pixHD是一种图像到图像的转换模型,它可以将输入图像转换成一种特定的输出图像。这种模型的应用非常广泛,例如将草图转换成真实的图片、将低分辨率图片转换成高分辨率图片、将黑白图像转换成彩色图像等等。
-
一个基于Ort的PaddleOCR推理应用。
-
LapSRN是一种用于超分辨率重建的神经网络模型,全称为Laplacian Pyramid Super-Resolution Network。它可以将低分辨率的图像增强到高分辨率,从而提高图像的质量和清晰度。LapSRN模型基于图像金字塔理论,采用多级金字塔结构,通过渐进性的上采样和细节增强,逐步提高图像分辨率。
-
-
Meta开源模型Llama-3
-
chatglm2-6b的推理
-
-
-
Granite-speech-3.3系列模型是一款小巧且高效的语音语言模型,专为自动语音识别(ASR)和自动语音翻译(AST)而设计。
-
-
MiniCPM-V 2.6是是 MiniCPM-V 系列中最新、性能最佳的模型。仅 8B 参数,但却取得 20B 以下单图、多图、视频理解 3 SOTA 成绩,一举将端侧 AI 多模态能力拉升至全面对标 GPT-4V 水平。
-
-
DiffusionDet: Diffusion Model for Object Detection
-
-
-
Kimi-VL-A3B-Thinking 由月之暗面开源发布的多模态模型,在多模态推理和智能体能力方面表现突出。
-
deepseek开发的多模态图片问答模型
-
多模态视觉大模型
-
OFA在一个简单的seq2seq的学习框架中统一了不同的跨模态和单模态的任务,包括图像生成、视觉定位、图像说明、图像分类、语言模型等,提出一种统一的多模态预训练范式,以解决复杂的任务/模态需要特殊定制模型架构的问题。