# 模型唯一标识 modelCode=2298 # 模型名称 modelName=Qwen3_Omni_vllm # 模型描述 modelDescription=Qwen3-Omni 是一款原生的端到端全模态基座模型,具备对文本、图像、音频及视频的统一理解与生成能力。 该模型在多项音视频基准测试中展现出卓越的业界领先(SOTA)性能,其语音识别、音频理解及交互对话能力已可媲美 Gemini 2.5 Pro;同时,得益于早期的“文本优先”预训练策略,它在强化多模态支持的同时,完全保留了顶级的纯文本与图像处理水平,并支持多达 119 种文本语言及 19 种语音输入的跨语言交互。 # 运行过程 processType=推理 # 算法类别 appCategory=多模态 # 框架类型 frameType=vllm # 加速卡类型 accelerateType=BW1000