# InternLM_2.5 ## 论文 `InternLM2 Technical Report` - [https://arxiv.org/pdf/2403.17297] ## 模型结构 Internlm2.5与Internlm2模型结构相同,但取得更好效果,Internlm2采用LLama和GQA结构,相较于Internlm改进了Wqkv的权重矩阵进行交错重排,不再简单堆叠每个头的Wk、Wq和Wv矩阵。此交织重排操作大概能提高5%的训练效率。