OFA在一个简单的seq2seq的学习框架中统一了不同的跨模态和单模态的任务,包括图像生成、视觉定位、图像说明、图像分类、语言模型等,提出一种统一的多模态预训练范式,以解决复杂的任务/模态需要特殊定制模型架构的问题。