,AI 创业公司 MosaicML 近日发布了其语言模型 MPT-30B,该模型具有 300 亿参数,训练成本“仅有其他同类竞品模型的零头”,有望促进行业逐步降低此类模型训练成本,扩大 AI 模型在更广泛领域的运用。
MosaicML 公司的首席执行官兼联合创始人 Naveen Rao 表示,MPT-30B 的训练成本为 70 万美元,远低于 GPT-3 等同类产品所需的数千万美元训练成本。此外,由于 MPT-30B 的成本较低,体积较小,它也可以更快速地被训练,并且更适合部署在本地硬件上。
据悉,MosaicML 使用了 Alibi 和 FlashAttention 技术来优化模型,可以实现更长的文本长度和对 GPU 计算的更高利用率。MosaicML 也是少数几个能够使用 Nvidia H100 GPU 的实验室,相比以往成果,当下每块 GPU 的吞吐量增加了 2.4 倍以上,可带来更快的完成时间。
除了让 AI 技术更容易获得之外,MosaicML 还专注于提高数据质量并提高模型性能。他们目前正在开发一款工具,可以帮助用户在预训练过程中分层加入特定领域的数据,以确保训练中开业实现多样化和高质量的数据组合。
MosaicML 公司表示,将模型扩展到 300 亿参数只是第一步,接下来他们将以降低成本为前提,推出体积更大、质量更高的模型。
IT之家注意到,目前开发者可以从 Hugging Face 下载并使用开源的 MPT-30B 基础模型,开发者还可以在本地硬件上使用自己的数据,对模型进行微调。
声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。
最新文章
- 东芝推出全球首项二氧化碳排放量实时测量技术
- 博帝推出VP4300Lite固态硬盘:读取
- “深圳惠民保”参保突破500万人投保通道4
- 大模型搅拌机来了,把11个AI的结果融合输
- 山灵推出新款SONO入耳式耳机:双动圈设计
- 398元,山灵推出新款SONO入耳式耳机:
- 乾景园林董事长回全福计划减持不超过1777
- 股价创历史新低!科兴制药:已向30+国家提
- AI热潮中PalantirPLTR.US涨
- Finalmouse发布超轻游戏鼠标Ult
- 衰退阴影挥之不去德国6月商业预期指数跌至年
- Vespa推出迪士尼联名款定制电动摩托车P
- 石药集团抗GFRAL抗体国内首家获批临床
- 海螺环保00587与海螺水泥订立替代燃料协
- 天安人寿迎来新时代中汇人寿获批保险许可证
- 小米13Ultra手机专业摄影套装白色版发
- 消息称第二代苹果AppleWatchUlt
- 工信部:培育一批中小企业特色产业集群
- 智翔金泰登陆科创板 在研产品竞争力突出
- 李学用——不断刷新“捷途速度”
- 小米推出RedmiBook15E笔记本电脑
- 腾讯会议推出龙芯LoongArch架构原生
- 上午切开的瓜傍晚还在卖切开卖的水果还新鲜吗
- 盛会现场,探营来了!
- 王慧文因“个人健康原因”辞任美团董事:AI
- 中欧基金策略周报:政策预期出现一定分化
- 全球首台200亿亿次级超算安装完成:20.