区块见闻 区块见闻
Ctrl+D收藏区块见闻

IND:横跨6种模态 Meta开源AI模型ImageBind 为虚拟世界打开大门_BAMBINO价格

作者:

时间:

来源:《科创板日报》

编辑宋子乔

当地时间5月9日,Meta宣布开源了一种可以将可以横跨6种不同模态的全新AI模型ImageBind,包括视觉、温度、文本、音频、深度信息、运动读数。目前,相关源代码已托管至GitHub。

何为横跨6种模态?

即以视觉为核心,ImageBind可做到6个模态之间任意的理解和转换。Meta展示了一些案例,如听到狗叫画出一只狗,同时给出对应的深度图和文字描述;如输入鸟的图像+海浪的声音,得到鸟在海边的图像。

美国众议员要求SEC对SBF被捕相关文件作出答复,指责其流程欠妥:6月23日消息,在6月22日举行的关于SEC监督的听证会上,美国众议院监督和调查小组委员会主席、密歇根州众议员Bill Huizenga近日表示,要求SEC提供与逮捕前FTX CEO Sam Bankman-Fried有关的一系列文件。委员会提供的关于SBF的指控和逮捕文件欠妥,据称这些文件在SBF的指控和逮捕方面提出了关于SEC的流程和与司法部合作的严重问题。

Huizenga表示,SEC提供的文件只包括公开简报,缺乏一些细节,他认为其他文件是一个“重要的过程和承诺。[2023/6/23 21:55:17]

Kyber Network在zkSync Era上部署KyberSwap聚合器和流动性协议:6月21日消息,Kyber Network宣布,已在zkSync Era上部署KyberSwap聚合器和流动性协议,集成Mute、Switch、SyncSwap、Velocore等DEX。[2023/6/22 21:52:57]

而此前的多模态AI模型一般只支持一个或两个模态,且不同模态之间难以进行互动和检索。ImageBind无疑具有突破性意义,Meta称,ImageBind是第一个能够同时处理6种感官数据的AI模型,也是第一个在没有明确监督的情况下学习一个单一嵌入空间的AI模型。

Kraken Pro已经开放LMWR充值:金色财经报道,Kraken Pro发推特表示,已经开放NFT市场Limewire代币LMWR充值,并将于北京时间今日20点开始交易。

此前消息,Limewire此前由Kraken Ventures、Arrington Capital和GSR牵头的私人融资中筹集了1000万美元。Limewire计划在5月以NFT市场的形式重新启动。[2023/5/16 15:05:13]

ImageBind能做到这些,核心方法是把所有模态的数据放入统一的联合嵌入空间,无需使用每种不同模态组合对数据进行训练

先利用最近的大型视觉语言模型它将最近的大规模视觉语言模型的零样本能力扩展到新的模态,它们与图像的自然配对,如视频-音频和图像-深度数据,来学习一个联合嵌入空间。

而以图像/视频为中心训练好AI后,对于原始数据中没有直接联系的模态,比如语音和热量,ImageBind表现出涌现能力,把他们自发联系起来。

有行业观察者已经迫不及待地将ImageBind于元宇宙联系在一起。

正如Meta的研究团队所说,ImageBind为设计和体验身临其境的虚拟世界打开了大门。该团队还表示,未来还将加入触觉、语音、嗅觉和大脑功能磁共振信号,进一步探索多模态大模型的可能性,“人类可使用多种感官学习、了解世界,借助ImageBin,机器离人类又近了一步”。

值得注意的是,Meta还表示,ImageBind可以利用DINOv2强大的视觉功能进一步提高其能力。DINOv2是Meta开源的计算机视觉领域的预训练大模型,同样与Meta的元宇宙愿景密不可分,MetaCEO扎克伯格此前强调,DINOv2可以极大地加持元宇宙的建设,让用户在元宇宙中的沉浸体验更出色。

尽管ImageBind目前只是研究项目,没有直接的消费者用户或实际应用。但可以想象的是,随着ImageBind模型逐步完善,AI应用场景将进一步拓展,元宇宙建设也将更进一步。

比如当ImageBind融入虚拟现实设备,使用者能获得更沉浸式的体验,玩家进入游戏后不仅能感受游戏场景的温度,还能感知物理层面上运动。

国盛证券分析师刘高畅此前大胆预测,1-5年内,随着多模态的发展带来AI泛化能力提升,通用视觉、通用机械臂、通用物流搬运机器人、行业服务机器人、真正的智能家居会进入生活。未来5-10年内,结合复杂多模态方案的大模型有望具备完备的与世界交互的能力,在通用机器人、虚拟现实等领域得到应用。

标签:MAGEMAGBININDAIMAGEmagicstoneBAMBINO价格CoinDD

以太坊价格热门资讯
DEF:以太坊上海升级后质押量不降反升 LSDFi的呼声水涨船高_SDF

4月份上海升级的完成使得质押的ETH可赎回,进而使LSD赛道变的完整起来。据21Shares研究分析师TomWan发推分析,以太坊信标链上的待定验证者数量已达到3.345万,创下历史新高,表明大.

ITG:香港与Web3,Bitget的布局与崛起_BITGEt最高返佣

香港,曾经在加密和Web3行业占据着举足轻重地位。吸引了最大稳定币发行商Tether、Bitfinex、Crypto.com的驻足。但其间因监管政策的摇摆不定促使部分加密Web3企业搬离香港.

GET:DeFi 质押借贷如何征税?英国政府发文解释_BITG

金融服务近年来迅猛发展,其中包括加密资产的增长。新形式的加密资产和由它们支持的服务正在不断发展。2018年3月,时任财政大臣推出了政府的金融科技行业战略.

RING:Meme 热潮席卷比特币网络 BTC是否“见顶”_比特币

随着基于比特币BRC-20标准的Meme代币交易量飙升至两年高位,比特币周一跌破2.75万美元,链上数据显示,从历史数据来看,模因币的投机狂热预示着比特币短期“见顶”或者看跌逆转.

区块链:Loopring研究报告_RIN

目录 一、项目简介及愿景 二、特色和优势 三、发展历史 四、团队背景 五、融资信息 六、发展成果 七、经济模型 八、基本面分析 九、风险与机会 一、项目简介及愿景 Loopring协议是一个专为.

区块链:模式币也讲生态?全面解析XEN业务逻辑_DXN

XEN起因 谷歌前21号员工提出了一种新的挖矿机制:参与证明,只需要提供ETH主网的gas费即可参与,可选择挖矿时间,时间越长能够提取的代币越多,全球rank排名越高能拿到的币也越多.