新闻资讯
关于我们 产品中心 解决方案 新闻资讯 客户案例 知识专区 售后服务 联系我们
新闻资讯:AI公司MosaicML推出70亿参数模型MPT-7B-8,号称“一次处理 8000 字长文本、可商用”
2023-7-28    点击关注我们

AI 创业公司 MosaicML 近日发布了其 70 亿参数模型 MPT-7B-8K,据悉,该模型一次可以处理 8000 字文本,相当擅长处理长文重点摘要和问答,还能在 MosaicML 平台上根据特定任务,进一步微调相关配置。

据悉,系列模型采用了 150 万个 Token,并以 256 块 H100 GPU 花 3 天完成模型训练而成。MosaicML 本次发布了 3 个版本模型,包括 MPT-7B-8k、MPT-7B-8k-Instruct 和 MPT-7B-8k-Chat。

其中,第一个版本 MPT-7B-8k、是以 Transformer 解码器为基础,并以 FlashAttention 和 FasterTransformer 机制来加速训练与推论,能一次处理 8000 字文本,MosaicML 公司表示,该模型开源、允许商用。

第二个版本 MPT-7B-8k-Instruct 是以第一个版本 MPT-7B-8k 微调而成,MosaicML 公司表示,MPT-7B-8k-Instruct 模型可处理长篇指令,特别注重于生成“摘要和问答”,该模型一样开源且可商用。

第三个版本 MPT-7B-8k-Chat 则是机器人对话式的 AI 模型,MosaicML 公司宣称,该模型额外多用了 15 亿个聊天数据 Token,在第一版模型 MPT-7B-8k 之上继续训练而成,该模型开源,但不允许商用。

据此前报道,MosaicML 公司也推出了一款号称训练成本仅为竞品零头的 MPT-30B 开源模型,该公司日前已将所有开源模型发布于 Huggingface 平台,感兴趣的小伙伴们可以前往进行相关了解,还可以在本地硬件上使用自己的数据,在下载后,对模型进行各种微调。

编 辑:章芳
阅读:537
虚假宣传、哄抬物价 数字藏品走红需填补监管空白
虚假宣传、哄抬物价 数字藏品走红需填补监管空白
单芯片光源创下数据传输新纪录
单芯片光源创下数据传输新纪录
Omdia预计富士康将成为全球最大的服务器供应商
Omdia预计富士康将成为全球最大的服务器供应商
DeepSeek引爆本地部署热,个人企业争相入局
DeepSeek引爆本地部署热,个人企业争相入局
TechInsights:预计 ASML High NA EUV 光刻机功耗约 1400 千瓦
TechInsights:预计 ASML High NA EUV 光刻机功耗约 1400 千瓦
App用户协议不能成“坑人协议”
App用户协议不能成“坑人协议”
手机影像未来技术突破口在哪?OPPO四项硬核创新技术给你答案!
手机影像未来技术突破口在哪?OPPO四项硬核创新技术给你答案!
中国信通院启动人形机器人应用场景图谱编制工作
中国信通院启动人形机器人应用场景图谱编制工作
WPS自断一臂,4亿不要了
WPS自断一臂,4亿不要了
反垄断风暴下的美团,高额罚款已在路上
反垄断风暴下的美团,高额罚款已在路上
上一篇:最新研究:AI发展使女性面临更大的失业风险
下一篇:被控窃取用户数据训练AI 律所诉请冻结谷歌Bard商用
关于我们 产品中心 解决方案 新闻资讯 客户案例 知识专区 售后服务 联系我们
我们的联系方式
100元上门4个小时服务电话-初中生100元3小时二维码联系方式是同城约茶联系方式,人到付款,找服务,不限次数,附近约茶联系方式,怎么,如何,00元3小时上门服务电话,上门服务电话号码、叫小妹服务,100/200/300/400/500/6789、本地同城附近服务,品茶,喝茶,过夜,酒店宾馆,qq,微信,会所,同城包小妹
点击拨打 100元上门4个小时服务电 咨询我们
长按指纹即可关注我们
微网站由云港互联设计开发  点击进入
【版权声明】本站部分内容由互联网用户自行发布,著作权或版权归原作者所有。如果侵犯到您的权益请发邮件致info@ynjwz.com,我们会第一时间进行删除并表示歉意。