,Meta 公司发布了一个新的开源人工智能模型 ImageBind,该模型能够将多种数据流,包括文本、音频、视觉数据、温度和运动读数等整合在一起。该模型目前只是一个研究项目,还没有直接的消费者或实际应用,但它展示了未来生成式人工智能系统的可能性,这些系统能够创造出沉浸式、多感官的体验。同时,该模型也表明了 Meta 公司在人工智能研究领域的开放态度,而其竞争对手如 OpenAI 和谷歌则变得越来越封闭。
Meta 公司称,其模型 ImageBind 是第一个将六种类型的数据整合到一个嵌入空间中的模型。这六种类型的数据包括:视觉;热力(红外图像);文本;音频;深度信息;以及最有趣的一种 —— 由惯性测量单元(IMU)产生的运动读数。(IMU 存在于手机和智能手表中,用于执行各种任务,从手机从横屏切换到竖屏,到区分不同类型的运动。)
未来的人工智能系统将能够像当前针对文本输入的系统一样,交叉引用这些数据。例如,想象一下一个未来的虚拟现实设备,它不仅能够生成音频和视觉输入,还能够生成你所处的环境和物理站台的运动。你可以要求它模拟一次漫长的海上旅行,它不仅会让你置身于一艘船上,并且有海浪的声音作为背景,还会让你感受到甲板在脚下摇晃和海风吹拂。
Meta 公司在博客文章中指出,未来的模型还可以添加其他感官输入流,包括“触觉、语音、气味和大脑功能磁共振成像信号”。该公司还声称,这项研究“让机器更接近于人类同时、全面、直接地从多种不同的信息形式中学习的能力。”
当然,这很多都是基于预测的,而且很可能这项研究的直接应用会非常有限。例如,去年,Meta 公司展示了一个人工智能模型,能够根据文本描述生成短而模糊的视频。像 ImageBind 这样的研究显示了未来版本的系统如何能够整合其他数据流,例如生成与视频输出匹配的音频。
对于行业观察者来说,这项研究也很有趣,因为IT之家注意到 Meta 公司是开源了底层模型的,这在人工智能领域是一个越来越受到关注的做法。
声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。
最新文章
- Fedora39新提案:使用mkosi-i
- 汽车国六b排放标准7月起实施中汽协:行业企
- 微软宣布7月15日弃用RemotePowe
- 百合花:控股股东新增质押921.20万股用
- 创新、卓越、担当:中鼎泰茂成功挂牌上海展现
- 我国首条磁浮盾构隧道双线贯通
- “十四五”期间中国物流业仍处于增量阶段仍有
- AMD锐龙Z1系列处理器功耗最低仅9W:比
- 以“雷达速度”迅速扩展销售网络吉利雷达杭州
- 鄂股年报丨路德环境去年净利骤降股权激励计划
- 巴菲特股东大会的“能源经”
- 原相3395传感器:漫步者G3MPRO三模
- 水晶光电获捷豹路虎多车型HUD项目定点
- 多地发布水泥错峰生产通知业界预计二季度行业
- 金刚光伏拟募20亿加码高效异质结电池转型聚
- 银行股大象起舞机构瞄准两条投资主线
- 必应聊天开放测试后添加GPU速度赶不上使用
- 从简单到复杂,密码学让我们的信息更安全
- 在270000000人次的共同见证下,这只
- AMD显卡新AIB伙伴瀚铠面向用户重新开放
- 消息称华为将推出小尺寸平板MatePadM
- 美的滚筒洗衣机V11F将于5月10日开售,
- 《堡垒之夜》入选2023首届奥林匹克电竞项
- 诺安基金邓心怡:前瞻互促逐浪科技诺安基金科
- 国家邮政局:4月中国快递发展指数为356.
- 最冷的行星有多冷
- 研究称女性比男性更适合太空旅行:体重轻、耗