M

mini-omni2_pytorch

Mini-Omni2是个视觉-音频助理,能同时处理视觉、听觉和文本三种多模态,实时提供端到端的语音对话响应。