Explore GitLab
Discover projects, groups and snippets. Share your projects with others
-
-
T1 模型是 TeleChat 系列专注于复杂推理的模型,由中国电信人工智能研究院基于国产算力研发训练。
-
使用MIGraphX对GPT2模型进行推理
-
-
-
-
基于TF2的bert模型文本分类、文本问答训练
-
字节提出的双层LLM模型HLLM仅需相当于基于传统ID方法1/6至1/4的数据量即可达到同等性能水平,较SOTA模型性能提升0.705%。
-
-
-
-
-
DeepSeek-V3.1 是一款支持 “思考模式” 与 “非思考模式” 双模式的混合模型。
-
-
-
-
通义千问模型推理
-
-
-