Explore GitLab
Discover projects, groups and snippets. Share your projects with others
-
-
用于开放词汇语义分割的简单编码器-解码器-SED模型的推理和训练
-
Wan2.1-T2V-14B 是阿里巴巴通义实验室研发的开源文本到视频(T2V)AI 模型,参数规模达 140 亿,依托扩散 Transformer(DiT)范式与 Wan-VAE 架构,结合 Flow Matching 技术及 T5 文本编码器,可精准解析文本提示并融合视觉信息,高效生成含复杂物体运动、镜头移动与自然动态交互的视频内容。
-
多模态语言大模型,可用于OCR,拥有较强的数学和理解能力
-
-
-
Co-DETR for learn more efficient and effective DETR-based detectors from versatile label assignment manners
-
YOLOv8 is the latest version of YOLO by Ultralytics
-
-
stable-diffussion推理范例
-
facebook在23年4月推出的最新的先进图像分割模型,论文地址:https://ai.facebook.com/research/publications/segment-anything/
-
Bert-Large based on Oneflow-Libai
-
Images Speak in Images: A Generalist Painter for In-Context Visual Learning
-
开源金融大模型
-
-
-
只有1.1B参数,减小了llama2模型规模和训练数据量,可以在许多基于Llama的开源项目中即插即用。
-
-
Mamba2提出了一种基于半可分离矩阵块分解的 SSD 算法,以显著提高训练效率