Explore GitLab
Discover projects, groups and snippets. Share your projects with others
-
test
-
MiniCPM-o 2.6是MiniCPM-o 系列的最新、性能最佳模型。总参数量 8B,视觉、语音和多模态流式能力达到了 GPT-4o-202405 级别,是开源社区中模态支持最丰富、性能最佳的模型之一。
-
-
该项目在 index-tts 的基础上使用 vllm 库重新实现了 gpt 模型的推理,加速了 index-tts 的推理过程。
-
An open-source computational fluid dynamics software accelerated by GPU called OpenCFD-SCU for direct numerical simulation of compressible turbulence. 一款使用了GPU加速主要用于可压缩湍流直接数值模拟的开源软件,OpenCFD-SCU。
-
S3Diff 是一种基于扩散先验的退化引导一步图像超分辨率方法
-
[ICCV 2025] STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution
-
image classification by transformer
-
Segment Anything Model 2 (SAM 2)是一个用于解决图像和视频中可提示视觉分割问题的基础模型。
-
GPT2 based on PyTorch
-
该模型用于区分伽马射线暴(GRB)信号与背景噪声,基于深度学习对不同时间窗(如256ms)的光变曲线数据进行二分类。采用ResNet-CBAM卷积神经网络架构,通过注意力机制增强关键时序特征,提升分类准确率。
-
-
Wan2.1-T2V-14B 是阿里巴巴通义实验室研发的开源文本到视频(T2V)AI 模型,参数规模达 140 亿,依托扩散 Transformer(DiT)范式与 Wan-VAE 架构,结合 Flow Matching 技术及 T5 文本编码器,可精准解析文本提示并融合视觉信息,高效生成含复杂物体运动、镜头移动与自然动态交互的视频内容。
-
基于 Ovis-U1,Ovis-Image 是一个 7B 的文本到图像模型,专门针对高质量文本渲染进行了优化,设计用于在严格的计算约束下高效运行。
-
KamNet是一个基于 PyTorch 的球面卷积神经网络实验项目,用于在球面 MNIST 数据集上进行旋转鲁棒的手写数字分类。它利用 S² 和 SO(3) 群上的等变卷积操作,使模型对三维旋转具有不变性,适用于几何深度学习和非欧数据建模研究。
-
Ankh是首个通用型蛋白质语言模型,在谷歌的TPU-V4上训练,以极大减少参数,实现了更高的准确率、更便捷的资源获取,从而促进研究创新,并超越了现有最先进性能的模型。
-
Step3 是一个先进的多模态推理模型,基于混合专家架构构建,拥有 321B 总参数,单token激活38B参数。
-
DETRs with Hybrid Matching
-