区块见闻 区块见闻
Ctrl+D收藏区块见闻
首页 > ICP > 正文

ROT:主网上线在即,AI 数据的分布式存储协议 EpiK 如何变垃圾数据为有效数据?_EPIK

作者:

时间:

撰文:ZeoZhang

来源:链闻ChainNews

腾讯创始人马化腾曾在2017年「迈进智能新时代」中国IT领袖峰会上坦言:

目前很多大数据是垃圾数据,因为没有标签,用再好的算法也算不出来,数据清洗、标签化难度非常高,我们甚至要耗费很多人工先清洗数据,再让AI学习。

一席话道出人工智能发展难点。在互联网计算机迭代数十年后,算法和算力的积累已将人工智能推向一个新的阶段,但缺乏高质量的有效数据,成为掣肘人工智能发展的重要原因之一。在解决这一问题上,测试网已经平稳运行一年的AI数据的分布式存储协议EpiKProtocol提出了结合区块链的解决方案。

2021年8月15日,测试网已经平稳运行一年的AI数据的分布式存储协议EpiKProtocol将正式上线主网。作为一个首次集数据标注、分布式存储以及数据应用等功能于一身的项目,EpiKProtocol尝试解决市场缺乏有效数据问题,构建共建共享共益的AI数据的分布式存储协议?

为什么缺乏有效数据?

一方面,平台默许甚至鼓励虚假的刷数据行为,造成无用数据横行。

对于传统互联网行业来说,刷数据现象司空见惯:新开的网店九成以上会选择刷单吸引客流量;即使是订阅量超百万的微信大号也经常通过刷阅读量满足广告客户的数据需求;更甚者,某旅游平台曾被爆出通过机器+人工的形式,冒充用户发表了数千万的用户评价,以假乱真,影响用户对产品的真实测评。

THORChain将在主网上推出借贷协议 THORFi Lending:8月14日消息,去中心化跨链交易协议THORChain已发布借贷协议THORFi Lending,并获得节点运营商批准。借贷功能将在主网上推出,届时抵押品将仅限于BTC与ETH。[2023/8/14 16:24:21]

对于一向标榜公开、透明、链上可追溯的区块链行业来说,刷数据现象仍不鲜见,分布式存储领域明星项目?Filecoin?也曾陷入「无效数据」质疑:在Filecoin网络刚上线时,较高的挖矿收益吸引大量矿工参与,甚至有部分矿工利用外部程序进行灌装虚拟数据或自己封装一些毫无价值的垃圾数据。

Filecoin存储算力快速暴增,从而导致存储的数据量短时间爆增。再加上Filecoin网络一开始无法对存储的数据进行分辨,真实有效数据极少,大量物理存储被浪费,对整个Filecoin生态发展带来不良影响。

另一方面,数据处理成本居高不下,多数人工智能不堪重负。

众所周知,人工智能需要不断深度学习,这需要庞大的数据量支撑。

庞大的用户群体每天活跃在互联网中,产生庞杂的数据。然而这些数据并不能被直接使用。人工智能的深度学习需要数据集的获得、数据的标注等,其中数据的标注会造成巨大的人力成本。

Pyth Network将在Solana主网上线 提供机构级市场数据:跨链预言机项目Pyth Network宣布将在Solana主网上线。开发者将能够在现有和新的DeFi平台和应用程序中集成Pyth实时喂价。除了在Solana高速区块链上构建,Pyth在未来几周内将能够通过Wormhole网络广播市场数据,以便通过以太坊、币安智能链(BSC)和Terra生态系统与DApp进行通信。

据悉,Pyth Network能够提供实时机构级市场数据的跨链预言机。Pyth Network提供加密货币、美国股票、外汇和商品市场的高保真数据流。[2021/8/26 22:37:29]

广泛应用深度学习网络需要大量已标注的数据进行训练才有可能达到预期的效果,但大数据时代下,虽然有海量的数据取之不尽,绝大部分却是未进行标注的数据,这些训练数据的标注需要人为进行。

对于数据品质要求越高,数据的标注需求就越精细,对标注人员的素质和专业知识的要求也就越高,相对应成本也越高。

长久以来,这些数据都由专门的数据标签分类公司进行加工处理,以供人工智能等数据需求领域发展使用。然而,用户-数据处理公司-数据需求者的三方协作,使得有价值的数据获取成本极高。

标注、存储、销售:EpiKProtocol的一站式数据服务

Crust公布主网上线计划及v1.3.0版经济白皮书:据官方消息,Crust公布了主网上线检查清单表、v1.3.0版经济白皮书及主网上线计划,可登录其官网进行查看。主网上线清单及计划将根据完成进度不定期更新完善。7月底,用户可以开始将以太坊上的ERC20 CRU代币认领到Crust主网;预计在8月12日,Crust主网开放节点接入,并开启CRU转账功能;8月下旬开放存储市场,提供文件存取;8月底9月初将进入正式运行阶段。[2021/7/19 1:02:51]

EpiKProtocol生态引入领域专家、赏金猎人、数据企业三类角色,致力于构建去中心化的大规模共建共享共益的AI数据存储协议,通过去中心化存储技术IPFS、去中心化自治组织DAO及通证经济模型,组织并激励全球社区成员将人类各领域知识梳理成可用的AI数据,并持续更新这一人类永恒知识库。

在数据标注方面,EpiKProtocol连接C端用户推出AI数据标注系统。

「领域专家」设计不同领域的AI数据格式,并发布数据标注任务;人人都能注册成为「赏金猎人」,参与数据标注成为AI老师,获得EPK代币奖励。

完成数据标注后,「赏金猎人」返还处理过的数据,「领域专家」验收所负责领域AI数据获得EPK代币奖励。此外,「领域专家」还会根据数据结果优化AI数据格式,良性循环下,数据质量得到不断提升。

Uniswap V3已在Optimism以太坊主网上线:7月14日,Uniswap V3宣布已在Optimism以太坊主网上线。在Alpha测试阶段,Optimism以太坊主网每秒可处理0.6笔交易,不过与Layer1不同的是,Optimism以太坊主网的交易可立即确认,没有等待时间。用户现可通过Optimism Gateway将资产向Optimism以太坊主网迁移,Optimism目前已支持Metamask、Wallet Connect等钱包,以及Etherscan和TheGraph等Dapp。[2021/7/14 0:51:49]

在数据存储方面,EpiKProtocol推出AI数据存储系统。

完成标注并通过验收的数据将由「领域专家」上传至AI数据存储系统进行分布式存储,参与数据存储的设备也都可以获得EPK代币奖励。

在数据销售方面,数据企业可通过质押EPK来访问数据,并从AI数据存储系统中付费下载有效数据。

由于EpiKProtocol的AI数据标注系统直接面向C端用户,消除了中间户数据标注公司的存在,简化了数据处理流转的各个环节,因此成本更低。以一条可用的AI语音方言数据为例:传统市场一条可用数据成本约在12元左右,而在EpiKProtocol系统成本约为2元,是传统市场的1/6。

链上ChainUP 市场VP Jade Chen:Filecoin挖矿入局者会在主网上线后迎来真正的考验:IPFS100.com现场报道,8月3日,由IPFS100.com主办,CapitalN节点咨询承办,金色算力云联合主办,深圳市先河系统技术有限公司金牌赞助,逆熵科技银牌赞助,金色财经作为联合主办媒体的星际漫游指南·逐鹿中原·IPFS技术与应用研讨论坛在郑州举行。

在主题为《Filecoin离落地商用还差什么》的圆桌环节,链上ChainUP 市场VP Jade Chen表示,Filecoin主网上线后可能会面临一地鸡毛的局面,但是鸡毛里能否飞出火凤凰,时间会告知我们答案。

她还指出,提到IPFS背后更多的是新基建。今年,政策层面在新基建方面给予了极大的支持,但是距离IPFS商业落地,还有一定的距离。[2020/8/3]

更重要的是,由于EpiKProtocol系统中有来自各行各业的「领域专家」把关数据治理,因此EpiKProtocol系统产生的有效数据更能够精准符合不同AI领域的数据需求。

协同B端、C端和行业专家的开放经济模式

不同于目前分布式存储主要围绕B端归档数据存储服务的商业模式,EpiKProtocol是一个协同B端企业、C端用户和领域专家的去中心化协同AI数据存储协议,在成本控制、收益提升和服务体验方面,都具有媲美中心化互联网巨头的能力。

C端用户:更低的数据标注门槛

EpiKProtocol针对C端用户打造了AI数据采集应用「知识大陆」,降低了数据标注门槛,同时提升了趣味性。卡通的界面和简明的布局让数据标注这种枯燥而繁杂的工作变为有趣的游戏,通过游戏化形式组织其全球社区成员共建大规模开放AI数据库。

各行各业都可以在「知识大陆」中创建AI数据类型,包括金融、医药、法律、社交、电商等,未来随着知识大陆的发展和运用,有数据需求的公司都可以选择在此进行共同协作收集整理并处理数据。

其次,EpiKProtocol的标注效率更高。AI数据标注系统运营三周以来,EpiKProtocol标注了17272条有效数据,且数据指标完整,每条数据被人工验证次数高达10次。相比较于传统标注方式,EpiKProtocol的标注效率高了近乎10倍。

最重要的是,参与EpiKProtocol数据标注的用户能够获得更高收益。传统数据标注模式中,数据处理者仅作为一种人工劳动力,并不享有数据分红权。而在EpiKProtocol中,对数据做出贡献所获得的EPK实际是获得了数据的股权,分享数据在后续使用过程中的盈利分红。后期数据需求越大,EPK需求就越高,EPK便会升值,EPK持有者便可以获益。

B端用户:激励有效数据

EpiKProtocolAI数据存储系统采取经典的1+3配置,即1Deamon+3Miners配置。与Filecoin相比,EpiKProtocolAI数据存储系统参与出块最小算力为0、存储免费,无需指定节点且默认无限份数、无限时间,更能够充分调度起每台闲置存储设备。

最重要的是,Filecoin存储无用数据也可获得算力,但EpiKProtocol存储系统中只有通过「领域专家」验证过的数据才可获得算力,这不仅保障了数据的高质量,而且进一步遏制了无效数据浪费存储空间的不良影响。

项目团队

EpiKProtocol拥有行业顶级顾问以及实力派投资机构。著名AI科学家、SigularityNET创始人、全球首个机器人公民Sophia之父的首席科学家BenGoertzel出任EPIK?铭识协议顾问,协助EPIK推动欧美数据市场,助力构建高质量的AI数据生态。

融资方面,EpiKProtocol获得了包括FBGCapital、JACKDAW、1475、ChainUpCapital、7O'clockCapital等机构的青睐,助力AI数据的分布式存储以新的势头进入大众视野。

主网即将上线

根据团队最新消息,EpiK「主网1.0罗塞塔」将于2021年8月15日中午12点正式上线。该时间也是EpiK测试网上线1周年的时刻。目前测试网5.0在测节点已超过6万个,稳定出块。

随着主网的日益临近,挖头矿也成为EpiKProtocol用户的关注焦点之一。作为EpiKProtocol生态激励代币,EPK总发行量为10亿,其具体分配规则如下:

1.创世团队:5%,每90天释放1/16;

2.基金会:5%,每90天释放1/4;

3.投资人:20%,每90天释放1/7;

4.社区:70%,出块速递每90天衰减一次,4年减半,分50年释放完毕。

EpiKProtocol拥有AI数据标注和AI数据存储两大系统,也对应了两种主要参与方式:

第一类,参与标注AI数据,成为EPK赏金猎人。利用闲暇时间参与标注不同AI领域数据,完成任务越多,EPK收益越高。认真答题还有机会赢取知识徽章NFT,后续可凭借NFT参与EPK空投活动。

第二类,参与存储AI数据,成为EPK存储节点。利用闲置的存储设备即可参与存储AI有效数据,每个存储节点需要完成1000EPK的基础质押才能拥有出块权。存储节点是随机获得出块机会的,但是其随机被选中的概率和其成功存储的数据大小挂钩:存的数据越多,被选中概率越高,同一个文件的Top100存储者享有双倍算力。

只有通过领域专家验证过的数据才被计为有效存储,存储节点才能获得算力,因此,为了获取更多的有效存储,就需要完成额外的流量抵押。1EPK可以用于访问10Mib数据,也可用于封装10Mib数据。目前,基础抵押提现的解锁期为0天,流量抵押提现的解锁期为3天。

结语

EpiKProtocol还开启了在分布式治理领域的探索,于7月20日发布了EpiKDAO。作为分布式存储赛道首个DAO治理模型,社区用户可以借助EpiKDAO参与EpiK生态资源的动态调节,有效保障EpiK社区的可持续发展,修复未来可能发生的资源错配问题。

随着Web3.0时代的日益来临,数据的重要性日益凸显。EpiKProtocol从数据标注到数据分布式存储再到对接企业实现数据应用,打造了一个低门槛、高效率的数据收益共享闭环,未来EpiKProtocol如何实现丰富的落地应用场景值得期待。

标签:AAVEEPIKLENDROTAave SUSDepikprime币的未来价值lend币交易行情Arkania Protocol

ICP热门资讯
AME:Reef回应Alameda指责:他们收到代币后就在币安出售,却声称是长期投资者_EDA

本文系链捕手原创文章,作者谷昱。昨晚,知名投资机构AlamedaReaseach发文指责ReefFinance不遵守场外交易约定,拒绝进行REEF代币购买交易,因此不建议外界与他们开展任何业务.

MED:朱嘉明:从交子到数字货币的文明传承_MEMEDOGE

编者按:经济学家,数字资产研究院学术与技术委员会主席朱嘉明教授,于今年1月12日在四川金融博物馆和中国钱币博物馆联合发起的“首届交子学术论坛暨‘交子节’发起仪式”上.

END:六一资本:如何获利千倍的AAVE_Compendium.Fi

来源:六一资本 价值投资理念是六一资本的核心投资理念,我们坚信互联网世界的今天,必然就是区块链世界的明天.

COIN:中国人民银行工作会议:2021年要稳妥开展数字人民币试点测试_YTH

1月4日,2021年中国人民银行工作会议以视频形式召开。会议以新时代中国特色社会主义思想为指导,深入学习贯彻党的十九届五中全会和中央经济工作会议精神,总结2020年主要工作,分析当前形势,

COI:FCoin重启调查:近2亿美元债务何去何从_GravityCoin

作者:龚荃宇,链捕手 注:本文于2020年7月23日在链捕手公众号首发FCoin合约平台FMEX的重启上线,以及相关公投的进行,FCoin近2亿美元FUSD债务问题的处理方案也越来越清晰化.

TEN:数据告诉你,大家都在挖哪些链游矿?_IST

本文作者为0xCC,律动BlockBeats。受AxieInfinity的影响,不少玩家开始寻找新的游戏以赚取游戏内的代币奖励,热情堪比当年在DeFi中找矿.