Explore GitLab
Discover projects, groups and snippets. Share your projects with others
-
微软自研小尺寸模型
-
-
FlagEmbedding专注于检索增强llm领域
-
引入反思机制,多模态任务生成屠榜,一键解锁AI绘图「哆啦 A 梦」任意门。
-
-
-
ollama框架下的deepseek_R1 模型
-
-
-
Qwen2-VL是基于Qwen2开发而成,在架构上的一大改进是实现了对原生动态分辨率的全面支持,与上一代模型相比,能够处理任意分辨率的图像输入。
-
-
-
-
Gemma是一个轻量级的,来自于Google的SOTA开源模型,利用与Gemini模型相同的研究和技术建造而成。它们是文本到文本、decoder-only的大型语言模型,使用英语,对pre-trained和instruction-tuned都具有开放权重。 Gemma模型非常适合各种文本生成任务,包括问题回答,总结和推理。它们相对较小的尺寸使得在资源有限的环境中部署它们成为可能。
-
Vllm并行解码
-
RepViT在iPhone 12上以1ms的延迟实现了超过80%的top-1准确率,为当前多个SOTA实例分割算法的backbone。
-
-
-
LLaMA Factory是一个大语言模型训练和推理的框架,支持了魔搭社区(ModelScope)的模型和数据集资源。它允许用户通过内置的Web UI灵活定制100多个LLMs的微调,而无需编写代码。
-
jina-embeddings-v3是一个多语言多任务文本嵌入模型,专为各种NLP应用而设计。