P

Phi-4-multimodal-instruct_pytorch

微软发布的强大的轻量级多模态基础模型Phi-4-MultiModal-Instruct!该模型目前具有英文的图像理解能力,同时有超过Whisper V3的视频理解能力!