新闻资讯，Hugging Face 研究“AI 降本增效”：给予更长运算时间让低成本小模型输出比拟大模型准确结果

新闻资讯：Hugging Face 研究“AI 降本增效”：给予更长运算时间让低成本小模型输出比拟大模型准确结果

2025-1-3 点击关注我们

目前业界模型性能通常与训练期间投入的资源绑定，除了头部厂商大肆投入资源训练模型外，许多小型企业和个人开发者实际上并不具备足够的资源，为了解决这一问题，许多团队试图寻找降本增效替代方案。

Hugging Face 于本月中旬公布一项报告，提出一种“扩展测试时计算（IT之家注：Test-Time Compute Scaling）”方法，也就是用时间来弥补模型体量，给予“低成本小模型”充足时间，让相关模型能够对复杂问题生成大量结果，再利用验证器对这些结果进行测试及修正，反复输出能够比拟“高成本大模型”的结果。

Hugging Face 团队表示，他们使用这种方法利用 10 亿参数的 Llama 模型进行数学基准测试，据称在某些情境下超越了参数量高达 70 亿的大型模型，证明了用时间提升模型输出内容效果做法可行。

此外，谷歌 DeepMind 最近也公布了类似的论文，他们认为可以为小模型动态分配运算资源，并设置验证器对模型的解答结果进行评分，从而引导模型不断输出正确的答案，从而帮助企业以较少的资源部署足够精度的语言模型。

编辑：章芳

阅读：179

首发！中国移动发布6G总体架构设计助力6G愿景实现

运营商的苦恼：不愿升级“搬迁”的4G钉子户

为减少虚拟现实骚扰行为，Meta推出个人边界功能

打造一个AI大模型，需要多少算力？

当AI剑指数据，企业如何才能智见安全？

浪潮信息龙蜥联合实验室成立：共推开源操作系统产业化

有生成式AI加成的谷歌搜索，能维持行业龙头吗？

中国移动发布“DPU技术白皮书” 三大方向解读标准化路径

新能源汽车下乡这4年：谁在逆袭，谁在迷失？

信通院政经所发布《实数融合发展观察（2025年）》

上一篇：美国四大科技巨头疯狂建设AI数据中心，2024年总投资约2180亿美元
下一篇：芯片上市提速 30%：业界首个面向半导体行业的专用大语言模型 SemiKong 发布

关于我们产品中心解决方案新闻资讯客户案例知识专区售后服务联系我们

我们的联系方式

100元上门4个小时服务电话-初中生100元3小时二维码联系方式是同城约茶联系方式，人到付款，找服务，不限次数，附近约茶联系方式，怎么，如何，00元3小时上门服务电话，上门服务电话号码、叫小妹服务,100/200/300/400/500/6789、本地同城附近服务，品茶，喝茶，过夜，酒店宾馆，qq，微信，会所，同城包小妹

点击拨打 100元上门4个小时服务电 咨询我们

微网站由云港互联设计开发点击进入