新闻资讯
关于我们 产品中心 解决方案 新闻资讯 客户案例 知识专区 售后服务 联系我们
新闻资讯:Hugging Face 研究“AI 降本增效”:给予更长运算时间让低成本小模型输出比拟大模型准确结果
2025-1-3    点击关注我们

目前业界模型性能通常与训练期间投入的资源绑定,除了头部厂商大肆投入资源训练模型外,许多小型企业和个人开发者实际上并不具备足够的资源,为了解决这一问题,许多团队试图寻找降本增效替代方案。

Hugging Face 于本月中旬公布一项报告,提出一种“扩展测试时计算(IT之家注:Test-Time Compute Scaling)”方法,也就是用时间来弥补模型体量,给予“低成本小模型”充足时间,让相关模型能够对复杂问题生成大量结果,再利用验证器对这些结果进行测试及修正,反复输出能够比拟“高成本大模型”的结果

Hugging Face 团队表示,他们使用这种方法利用 10 亿参数的 Llama 模型进行数学基准测试,据称在某些情境下超越了参数量高达 70 亿的大型模型,证明了用时间提升模型输出内容效果做法可行。

此外,谷歌 DeepMind 最近也公布了类似的论文,他们认为可以为小模型动态分配运算资源,并设置验证器对模型的解答结果进行评分,从而引导模型不断输出正确的答案,从而帮助企业以较少的资源部署足够精度的语言模型。

编 辑:章芳
阅读:178
AI智能体开启拜年新风尚 上市公司布局忙
AI智能体开启拜年新风尚 上市公司布局忙
618彩电市场报告:线上零售量规模同比下降12.9%
618彩电市场报告:线上零售量规模同比下降12.9%
具身智能投身高端制造业 产学研协同加速产业化进程
具身智能投身高端制造业 产学研协同加速产业化进程
“霸屏广告”侵入手机 哪些漏洞亟待填补
“霸屏广告”侵入手机 哪些漏洞亟待填补
抖音悄悄打造“全家桶”
抖音悄悄打造“全家桶”
海康威视的资本谋局:两度分拆机器人业务拟冲刺创业板
海康威视的资本谋局:两度分拆机器人业务拟冲刺创业板
谷歌CEO:量子计算技术犹如10年前的AI 真正切实可用还要5到10年
谷歌CEO:量子计算技术犹如10年前的AI 真正切实可用还要5到10年
数字科技消费应用场景特辑(五) 低空经济:十大应用场景研究
数字科技消费应用场景特辑(五) 低空经济:十大应用场景研究
被“反噬”的硅谷大厂: 裁员潮涌 经济严冬下为过度扩张埋单
被“反噬”的硅谷大厂: 裁员潮涌 经济严冬下为过度扩张埋单
软银携手OpenAI在日本成立合资公司,将开启日版“星际之门”?
软银携手OpenAI在日本成立合资公司,将开启日版“星际之门”?
上一篇:美国四大科技巨头疯狂建设AI数据中心,2024年总投资约2180亿美元
下一篇:芯片上市提速 30%:业界首个面向半导体行业的专用大语言模型 SemiKong 发布
关于我们 产品中心 解决方案 新闻资讯 客户案例 知识专区 售后服务 联系我们
我们的联系方式
100元上门4个小时服务电话-初中生100元3小时二维码联系方式是同城约茶联系方式,人到付款,找服务,不限次数,附近约茶联系方式,怎么,如何,00元3小时上门服务电话,上门服务电话号码、叫小妹服务,100/200/300/400/500/6789、本地同城附近服务,品茶,喝茶,过夜,酒店宾馆,qq,微信,会所,同城包小妹
点击拨打 100元上门4个小时服务电 咨询我们
长按指纹即可关注我们
微网站由云港互联设计开发  点击进入
【版权声明】本站部分内容由互联网用户自行发布,著作权或版权归原作者所有。如果侵犯到您的权益请发邮件致info@ynjwz.com,我们会第一时间进行删除并表示歉意。