区块见闻 区块见闻
Ctrl+D收藏区块见闻
首页 > 比特币 > 正文

在元宇宙里怎么交朋友?Meta发布跨语种交流语音模型 支持128种语言无障碍对话

作者:

时间:

改名 Meta 之后,Facebook 的元宇宙愿景正在一点点实现。这一次,Facebook 把目光投在了元宇宙社交上。

Meta 发布语音处理模型 XLS-R

近日,Meta 正式发布 XLS-R——一套用于各类语音任务的新型自监督模型。据悉,XLS-R 由海量公共数据训练而成(数据量是过去的十倍),能够将传统多语言模型的语言支持量增加两倍以上。目前,XLS-R 共支持 128 种语言。

Meta 认为,语音交流是人们最自然的一种交互形式。“随着语音技术的发展,我们已经能够通过对话同自己的设备及未来的虚拟世界直接互动,由此将虚拟体验与现实世界融为一体。”

这与扎克伯格此前宣称的“公司业务将以元宇宙优先”不谋而合。此前,扎克伯格曾概述了他建立“元世界”的计划:一个建立在我们自己的数字世界之上的数字世界,包括虚拟现实和增强现实。“我们相信元宇宙将会接替移动互联网”。

而 XLS-R 作为元宇宙社交中必不可少的一环,可以帮助母语不同的人在元宇宙无障碍对话。

值得一提的是,为了通过单一模型实现对多种语言的广泛语音理解能力,Meta 对 XLS-R 进行了微调,使其获得语音识别、语音翻译及语言识别等功能。据介绍,XLS-R 在 BABEL、CommonVoice 以及 VoxPopuli 语音识别基准测试,CoVoST-2 的外语到英文翻译基准测试,以及 VoxLingua107 语言识别基准测试中都取得了不错的成绩。

比特币锚定币总锁仓量突破137亿美元 创下历史新高:金色财经报道,随着比特币价格重回到5万美元上方,比特币锚定币总锁仓量也上涨并创下历史新高。据DeBank数据显示比特币锚定币总锁仓量已突破137亿美元,本文撰写时为137.3亿美元。

比特币锚定币是发行在非比特币网络上的价格锚定于原生比特币的一类特殊代币,目前总发行量超过27.4万枚,按锁仓量排名前三的比特币锚定币分别是:1、WBTC:锁仓量9,933,379,445美元;2、HBTC:锁仓量1,999,789,063美元;3、renBTC:锁仓量772,197,831美元。

据Coingecko数据显示,目前比特币价格为50127.97美元,24小时涨幅为5.8%。[2021/9/2 22:55:09]

为了尽可能降低功能访问门槛,目前,Meta 与 Hugging Face 联手发布了模型本体,并通过 fairseq GitHub repo 全面开放。

试用地址:https://huggingface.co/spaces/facebook/XLS-R-2B-22-16

XLS-R 工作原理

据介绍,XLS-R 在 wav2vec 2.0 训练集上接受了超过 43 万 6 千小时的公开语音录音训练,从而实现了对语音表达的自监督学习方法。这样的训练量已经达到去年发布的当时最强的模型 XLSR-53 的 10 倍。利用从会议记录到有声读物的多种语音数据来源,XLS-R 的语言支持范围扩展到 128 种,涵盖的语种量达到前代模型的近 2.5 倍。

作为 Meta 打造的有史以来最大模型,XLS-R 中包含超过 20 亿个参数,性能远高于其他同类模型。Meta 表示,事实证明,更多参数能够更充分地体现、数据集中的各类语种。此外,Meta 还发现,规模更大的模型在单一语言预训练方面的性能也同样优于其他较小模型。

Meta 在四种主要多语言语音识别测试中对 XLS-R 做出评估,发现它在 37 种语言上获得了超越以往模型的效能。具体测试场景为:BABEL 中选取 5 种语言,CommonVoice 中选取 10 种语言,MLS 中选取 8 种语言,以及 VoxPopuli 上选取 14 种语言。

BABEL 上的单词错误率基准测试结果。XLS-R 较前代模型实现了显著改进。

此外,Meta 还评估了语音翻译模型,即将录音资料直接翻译成另一种语言。为了打造一套能够执行多种任务的模型, Meta 同时在 CoVoST-2 基准测试的数个不同翻译方向上对 XLS-R 进行了微调,使其能够在英语与多达 21 种语言之间实现内容互译。

在使用 XLS-R 对英语以外的其他语言进行编码时,获得了显著的效能提升,这也是多语言语音表达领域的一次重大突破。据 Meta 介绍,XLS-R 在低资源语言学习中实现了显著改进,例如印尼语到英语的翻译,其中 BLEU 准确率平均翻了一番。BLEU 指标的提升是指模型给出的自动翻译结果与处理同一内容的人工翻译结果间重合度更高,代表着模型在改进口语翻译能力方面迈出了一大步。

以 BLEU 指标衡量的自动语音翻译准确率,其中较高值表示 XLS-R 从高资源语言(例如法语、德语)、中资源语言(例如俄语、葡萄牙语)或低资源语言(例如泰米尔语、土耳其语)语音记录翻译至英语时的准确率。

Meta 认为,XLS-R 证明扩大跨语言预训练规模可以进一步提高低资源语言的理解性能。它不仅提高了语音识别率,同时也将由外语到英语的语音翻译准确率提高了一倍以上。

“XLS-R 是我们朝着以单一模型理解多种不同语言(语音)目标迈出的重要一步,也代表着我们在利用公共数据推进多语言预训练方面做出的最大努力。我们坚信这是一条正确的探索方向,将让机器学习应用更好地理解所有人类语音、并促进后续研究,大大降低语音技术在全球范围内、特别是服务匮乏社群中的使用门槛。我们将不断开发新方法,通过低监督学习拓展模型的语言理解能力、逐步使其覆盖全球 7000 多种语言,实现算法的持续更新。”Meta 提到。

https://ai.facebook.com/blog/xls-r-self-supervised-speech-processing-for-128-languages/

标签:XLSMETETANFTXLS价格metis币怎么样metamask下载教程PNFT币

比特币热门资讯
解救阿桑奇?投机者积聚AssangeDAO

解救维基解密创始人朱利安·阿桑奇(Julian Assange)是一个足够大的目标,这个充满争议的人物曾因泄密美国政府丑闻被通缉,在获得厄瓜多尔政府庇佑近7年后,他被关进伦敦一所监狱。而美国政府一直试图将其引渡回国,终于去年12月10日,英国高等法院做出了允许引渡的判决,这使得阿桑奇可能在美获得长达175年的监禁。

一文探索创作者经济的未来和创作者DAO

如果 Facebook、Instagram、Twitter 或 TikTok 由其用户拥有和运营,世界会是什么样子?如果这些用户也对数据收集和内容审核等问题进行投票呢?这就是创造者经济应该是什么样子的想象未来。 创造者经济在 2021 年吸引了超过 13 亿美元的资金。但谁占据了这些平台产生的大部分资金呢?不是它的创造者。

NFT的探索

NFT在早期的价值形成过程当中,大多数人只是寻觅一个共识较强的价值锚定物而已。 早期的NFT的很难有实质性的用途,因为基础工具的缺失。但加密个人确权的时代到来,导致这个时候应该会形成一类核心的共识储值类NFT。由于是早期的储值NFT,所以它可能存在一定的瑕疵(可发展性弱),就如同BTC除了储值一点用都没有。

诺奖得主Paul Krugman:对比分析本次加密市场下跌与08年次贷危机有何不同?

2008 年诺贝尔经济学奖得主 Paul Krugman 发推分享了对目前加密货币市场与 2008 年次贷危机进行对比的分析。在具体分析之前,他明确表示市场上加密货币持有者认为这是抄底机会,而他不做价格预测,只是分析数据。 Crypto 投资者将目前加密货币市场与 2017-18 年的「加密冬天」进行比较,认为两者在比例变化上具有可比性。

加密交易者需要避免的14种常见认知偏差

为了成为更好的加密投资者,我研究了数百种认知偏差。以下是最重要的 14 个: 单位偏差 人们更愿意购买代币的“整个单位”,而不是其中的一小部分。这就是模因代币爆炸的原因。不要因为它“便宜”而夸大代币的价值。请了解市值如何运作。 锚定偏差 过度依赖你拥有的第一条信息。你听说过 1000 美元的比特币。你错过了。然后它上升到 5,000 美元。

逐层分解Web3的组成架构

行业已经对Web3提出了许多定义,但在Coinbase,我们通常认为Web3是一个利用区块链技术的无信任、无许可和去中心化的网际网路。 Web3的定义特徵主要来自“所有权”。