新闻资讯
关于我们 产品中心 解决方案 新闻资讯 客户案例 知识专区 售后服务 联系我们
新闻资讯:通义千问发布新一代端到端旗舰模型Qwen2.5-Omni
2025-4-25    点击关注我们

阿里云宣布今天发布新一代端到端多模态旗舰模型Qwen2.5-Omni。

该模型专为全方位多模态感知设计,能够无缝处理文本、图像、音频和视频等多种输入形式,并通过实时流式响应同时生成文本与自然语音合成输出。

据介绍,Qwen2.5-Omni采用Thinker-Talker双核架构。

其中,Thinker 模块如同大脑,负责处理文本、音频、视频等多模态输入,生成高层语义表征及对应文本内容。

而Talker模块则类似发声器官,以流式方式接收Thinker实时输出的语义表征与文本,流畅合成离散语音单元。

测试中,Qwen2.5-Omni在包括图像,音频,音视频等各种模态下的表现都优于类似大小的单模态模型以及封闭源模型,例如Qwen2.5-VL-7B、Qwen2-Audio和Gemini-1.5-pro。

阅读:5
直击雷军年度演讲:全球第二、上市破发、高端市场、起诉美国政府
直击雷军年度演讲:全球第二、上市破发、高端市场、起诉美国政府
半年股价腰斩 阿里健康为什么不香了?
半年股价腰斩 阿里健康为什么不香了?
制造业人工智能的场景应用落地现状、难点和建议
制造业人工智能的场景应用落地现状、难点和建议
数据中心的功耗难题,液冷能解决吗?
数据中心的功耗难题,液冷能解决吗?
全球热门 AI 模型及其功能和使用方式
全球热门 AI 模型及其功能和使用方式
短视频、盲盒等新消费模式受追捧 听听全国两会代表委员怎么说
短视频、盲盒等新消费模式受追捧 听听全国两会代表委员怎么说
记者调查:App自动续费“连环计”防不胜防
记者调查:App自动续费“连环计”防不胜防
国产开源,阔步前行:openEuler再进阶
国产开源,阔步前行:openEuler再进阶
未来五年,20%的以太网数据中心交换机端口将连接到AI服务器
未来五年,20%的以太网数据中心交换机端口将连接到AI服务器
Web3夹在了新旧世界之间
Web3夹在了新旧世界之间
上一篇:博鳌关键词之“智能应用”:AI驱动变革,在应用中塑造核心竞争力
下一篇:AI抢滩基础工作 券商分析师坚守深度研究主场
关于我们 产品中心 解决方案 新闻资讯 客户案例 知识专区 售后服务 联系我们
我们的联系方式
联系地址:云南省昆明市官渡区永平路188号鑫都韵城写字楼6栋1004号
联系电话:0871-64605728、传真号码:0871-64605728
电子邮箱:19701580@qq.com
点击拨打 0871-64605728 咨询我们
长按指纹即可关注我们
微网站由云港互联设计开发  点击进入
【版权声明】本站部分内容由互联网用户自行发布,著作权或版权归原作者所有。如果侵犯到您的权益请发邮件致info@ynjwz.com,我们会第一时间进行删除并表示歉意。