新闻资讯
关于我们 产品中心 解决方案 新闻资讯 客户案例 知识专区 售后服务 联系我们
新闻资讯:通义千问发布新一代端到端旗舰模型Qwen2.5-Omni
2025-4-25    点击关注我们

阿里云宣布今天发布新一代端到端多模态旗舰模型Qwen2.5-Omni。

该模型专为全方位多模态感知设计,能够无缝处理文本、图像、音频和视频等多种输入形式,并通过实时流式响应同时生成文本与自然语音合成输出。

据介绍,Qwen2.5-Omni采用Thinker-Talker双核架构。

其中,Thinker 模块如同大脑,负责处理文本、音频、视频等多模态输入,生成高层语义表征及对应文本内容。

而Talker模块则类似发声器官,以流式方式接收Thinker实时输出的语义表征与文本,流畅合成离散语音单元。

测试中,Qwen2.5-Omni在包括图像,音频,音视频等各种模态下的表现都优于类似大小的单模态模型以及封闭源模型,例如Qwen2.5-VL-7B、Qwen2-Audio和Gemini-1.5-pro。

阅读:6
新闻摘要频繁“翻车”,苹果AI远未成熟
新闻摘要频繁“翻车”,苹果AI远未成熟
《财富》世界500强揭晓:华为位列中国高技术企业第一 去年盈利123亿美元
《财富》世界500强揭晓:华为位列中国高技术企业第一 去年盈利123亿美元
大佬的2022 | 破壁的何小鹏
大佬的2022 | 破壁的何小鹏
伊春移动党委多举措打击治理电信网络诈骗工作
伊春移动党委多举措打击治理电信网络诈骗工作
人工智能成两会热词,发展速度“让硅谷震惊”,中国科技热潮刷新外媒印象
人工智能成两会热词,发展速度“让硅谷震惊”,中国科技热潮刷新外媒印象
华为腾讯盯上网约车生意
华为腾讯盯上网约车生意
自动驾驶企业“过冬”?
自动驾驶企业“过冬”?
中国电信开展 6G 分布式网络架构及关键技术验证
中国电信开展 6G 分布式网络架构及关键技术验证
微软 .NET 6 首个预览版发布:安卓 / iOS 多平台 App UI,尝鲜支持 Mac M1
外媒 Neowin 报道,微软在几个月前宣布了 .NET 5,作为通往 .NET 统一的第一步,其目标是拥有一套单一的 API、语
“软件定义一切”的关键条件,红帽让开源创新无处不在
“软件定义一切”的关键条件,红帽让开源创新无处不在
上一篇:博鳌关键词之“智能应用”:AI驱动变革,在应用中塑造核心竞争力
下一篇:AI抢滩基础工作 券商分析师坚守深度研究主场
关于我们 产品中心 解决方案 新闻资讯 客户案例 知识专区 售后服务 联系我们
我们的联系方式
联系地址:云南省昆明市官渡区永平路188号鑫都韵城写字楼6栋1004号
联系电话:0871-64605728、传真号码:0871-64605728
电子邮箱:19701580@qq.com
点击拨打 0871-64605728 咨询我们
长按指纹即可关注我们
微网站由云港互联设计开发  点击进入
【版权声明】本站部分内容由互联网用户自行发布,著作权或版权归原作者所有。如果侵犯到您的权益请发邮件致info@ynjwz.com,我们会第一时间进行删除并表示歉意。