Explore GitLab
Discover projects, groups and snippets. Share your projects with others
-
-
Olmo3是一个新的 7B 和 32B 模型系列,包括 Instruct 和 Think 变体。长链思维可以改进数学和编码等推理任务。
-
End-to-End Object Detection with Transformers
-
轻量化之王MobileNetV4,手机推理速度 3.8ms,在移动CPU、DSP、GPU以及苹果M处理器和谷歌Pixel Edge TPU全都高性能。
-
Qwen2-VL是基于Qwen2开发而成,在架构上的一大改进是实现了对原生动态分辨率的全面支持,与上一代模型相比,能够处理任意分辨率的图像输入。
-
Step-Video-T2V是一个目前最先进的文本到视频预训练模型,拥有300亿个参数,能够生成最长204帧的视频。
-
llama验证工具库
-
-
-
DeepSeek-Coder is a family generation models
-
-
StarCoder2 is a family of code generation models
-
BLIP3-o可用于多模态数据预标注,通过60k指令调优数据集BLIP3o-60k进行增强,全开源统一多模态模型,支持文本到图像生成、图像描述以及视觉问答在内的多种任务。
-
实现目标跟踪的大统一
-
Pix2pixHD是一种图像到图像的转换模型,它可以将输入图像转换成一种特定的输出图像。这种模型的应用非常广泛,例如将草图转换成真实的图片、将低分辨率图片转换成高分辨率图片、将黑白图像转换成彩色图像等等。
-
一个基于Ort的PaddleOCR推理应用。
-
LapSRN是一种用于超分辨率重建的神经网络模型,全称为Laplacian Pyramid Super-Resolution Network。它可以将低分辨率的图像增强到高分辨率,从而提高图像的质量和清晰度。LapSRN模型基于图像金字塔理论,采用多级金字塔结构,通过渐进性的上采样和细节增强,逐步提高图像分辨率。
-
-
Meta开源模型Llama-3