区块见闻 区块见闻
Ctrl+D收藏区块见闻

数字货币:想做好区块链数据分析?先来看看如何解决“去匿名化”这个大难题_数字货币被最好的解决办法

作者:

时间:

在最近的会议演讲中我经常会被问到:区块链数据分析的最大挑战是什么?我的回答就一个词:去匿名化。

我坚定地认为,识别不同类型的参与者并理解其行为是解锁区块链分析潜力的核心挑战。我们花费了相当多的时间来考虑这个问题以识别出与数字货币运动的伦理不发生冲突的正确边界。在这篇文章里,我想进一步探讨这个思路。

市场上大多数区块链的架构依赖于匿名或伪匿名机制来保护其节点的隐私并实现去中心化。数据混淆机制可以将加密资产交易数据记录在公开的账本上让每个人都能访问,但是也让分析这些数据变得异常困难。

如果不能识别参与者的身份,就很难理解区块链数据集并分析出有意义的结果,而且区块链分析只能徘徊在初级阶段。然而,重要的一点是要理解,去匿名化区块链数据集并不是要知道账本中每个地址的真实身份,这个方向基本上是不具备可扩展性的可能。

Balancer宣布将其技术部署到Avalanche链上:金色财经报道,Balancer在社交媒体上称,正在将其技术部署到Avalanche链上,以推动Liquid Staked代币的增长,并为参与者提供独特灵活的DeFi技术堆栈。

Balancer表示,与DEX为LST实施的典型稳定池相比,Balancer的可组合稳定池以编程方式定制,以确保Yield Bearing代币的全部权力流向流动性提供者。这些独特的池利用内置的利率提供者,不断查询区块链,将代币更新为正确的比率,并将应计收益反馈给有限合伙人。Balancers加权数学还为所有协议提供了在 Avalanche 上实施#ve8020的能力。允许协议建立原生代币流动性,减轻唯利是图的激励计划,并解锁治理代币经济的下一阶段。[2023/8/2 16:12:48]

相反的,我们可以识别并理解区块链中已知参与者的行为,例如交易所、OTC柜台、矿工以及其他构成区块链生态系统的核心成员。

Fake_Phishing156044 已将21枚ETH经由EOA地址转入Tornado Cash:金色财经消息,据CertiK官方推特发布消息,被Etherscan标注为Fake_Phishing156044 已将21枚ETH(约4.02万美元)经由EOA地址(0xBdB7b)转入Tornado Cash。至此近10日内,该地址已经存入约131枚ETH。[2023/7/1 22:12:03]

地址数量会不知不觉误导你

网络的量度是区块链分析中无所不在的一个指标,也是一个可以清晰地展示去匿名化威力的指标。

地址数量是最常见的一个具有误导性的指标,因为并非所有的地址都同等重要。交易创建的一个用于临时性转账的地址,显然不能和另一个长期持有资产的钱包地址相提并论。

Coinbase股价自低点已上涨近50%,分析师认为上涨可能是短暂的:6月29日消息,Coinbase股价自低点已上涨近50%。自从贝莱德宣布提交比特币ETF申请以来,Coinbase的股价一直在大幅上涨。该公司股价已从6月15日的每股约52美元上涨至撰写本文时的每股71美元,弥补了自美国证券交易委员会本月初宣布对该交易平台提起诉讼以来的所有损失。

但Berenberg Capital Markets的分析师Mark Palmer在给客户的一份报告中表示,围绕COIN的热情可能是短暂的。这位分析师给予该股持有评级,目标价为39美元,他表示,投资者将COIN视为增加机构与数字资产生态系统参与度的一种方式,应该首先考虑该公司面临的风险,这些风险可能会导致在不久的将来负面新闻将引发该股近期涨幅的逆转。[2023/6/29 22:08:49]

类似的,像币安这样的交易所的热钱包,肯定也不同和我的个人钱包采用同样的方法和指标去分析。同等对待所有地址的匿名性,注定会导致解读的有限性并且经常会得出误导性的结论。

匿名性vs.可解读性

匿名或伪匿名身份是可伸缩的去中心化架构的关键因素之一,但是这也让从区块链数据集中获取有价值的信息变得极端困难。理解这一观点的一个办法,就是把匿名性视为区块链分析的可解读性的一个反因子。

在区块链数据集中匿名性与可解读性之间的摩擦相对来说还比较小。一个区块链数据集的匿名性越高,从中获取有意义的信息的难度就越大。参与者的身份提供了其行为的上下文环境,而上下文环境则是可解读性的关键构建模块。

去匿名化vs.打标签

「你是什么」远比「你是谁」要重要。

去匿名化区块链数据集并不涉及了解每个参与者的真实身份。试图了解每个用户的真实身份不仅是一个意义重大的任务,而且也会让分析工作难以突破一定的规模。

相反,我们可以试着理解一个参与者的关键特征来让我们的分析达到一定程度的可解读性。因此,不需要清楚地识别每个地址的真实身份,我们可以给地址打标签或者附加一些描述性的元数据,来让其行为具备一定的上下文环境。

在大规模数据中,打标签常常要比个体识别更有效果。理解区块链生态系统中特定个体的行为当然会让分析达到更个性化的程度,但是对于在宏观层面理解行为的趋势就显得相对受限了。

因此,相对与对区块链地址的个体真实身份的识别,去匿名性的挑战与地址的关键性属性的标注的关系更大。我们如何实现这一点?

机器学习会是一个优秀的解决方案

标注或者去匿名化区块链的思路可以让区块链分析更好地生态中已知参与者的行为模式和特征。直觉上我们可以考虑创建一些规则来分析区块链生态系统中的不同成员,例如:

“如果一个地址持有大量比特币地址并且一次执行100个交易,那么这是一个交易所地址……”

虽然很有吸引力,但是基于规则的方法将很快失效,无法再提供有用的信息。下面列出了部分原因:

预置知识的完整性:基于规则的分类会假定我们对于如何识别区块链生态中的不同参与者有足够的知识。这显然是不正确的假设。

持续的变化:区块链解决方案的架构一直都在演变,这对任何嵌入的规则而言都是挑战。

特征属性的数量:创建一条有两三个参数的规则很简单,但是试图创建一条有几十个甚至上百个参数的规则就没那么简单了。要识别出像交易所或OTC柜台这样的地址需要大量的特征。

因此我们不能使用预置的规则,我们需要一种可以从区块链数据集中学习模式的机制来自动推断出有意义的规则让我们可以标注相关的参与方。从概念上来说,这是一个经典的机器学习问题。

从机器学习的观点,我们应该从两个主要途径来考虑应对去匿名化的挑战:

无监督学习:无监督学习聚焦于学习指定数据集中存在的模式并识别相关分组。在区块链数据集的上下文中,可以使用无监督学习模型基于地址的特征将其匹配到不同的分组中并对这些分组进行标注。

监督学习:监督学习方法可以利用已有的知识来学习指定数据集中的新的特性。在区块链上下文中,可以使用监督学习方法基于已有的交易所地址数据集训练一个模型来识别出新的交易所地址。

去匿名化或者给区块链数据集打标签很少是只用监督学习或者只用非监督学习,更多的情况下需要两种方法的结合。机器学习模型可以有效地学习区块链生态系统中特定参与者的特征,并利用这些特征来理解其行为。

在使用区块链ETL工具将区块链原始数据加载到数据库或大数据分析平台后,将标注层引入区块链数据集是进行更有价值的区块链数据分析的一个关键挑战。

这些标签提供了更好的上下文环境,也让区块链分析模型具有更好的可解读性。不过尽管我们有机器学习这样强大的工具,去匿名性依然是分析理解区块链生态系统的道路上一个不可忽视的重大路障。

本文来源于“区块链大本营”。

标签:区块链OTCTOP数字货币区块链dapp开发一个多少钱hotcs币什么价格bitop交易所怎么样数字货币被最好的解决办法

比特币交易热门资讯
LUC:区块链社区运营干货,用户思维助力社区生态建设!_Lucky Shinu

“今年开始,“区块链+”的诞生标志着,区块链技术将赋能更多行业!区块链作为数字技术的一种,最重要的特点就是提供了一个低成本、高效达成信任的工具,解决传递价值时存在的信用问题.

TOP1:震惊!两个人两月内突击注册54家“区块链公司”,20家查无处所_Utopian Protocol

自2016年12月国务院印发《“十三五”国家信息化规划》将区块链技术列为战略性前沿技术以来,国家对区块链技术的关注程度不断提高,据零壹智库不完全统计,截至2019年10月.

人工智能:盘和林:随着未来大数据、区块链等技术日趋成熟,产业数字化发展未来可期_人工智能币有哪些

人民网今日刊登中南财经政法大学数字经济研究院执行院长盘和林文章《金融科技如火如荼产业数字化发展未来可期》,文章指出,近年来,随着区块链等技术的快速发展及应用场景的不断延伸.

USDT:Binance JEX上线周BTC期权1211公告_南瓜usdt币

周BTC看涨期权 代码周BTC看涨1211期权标的BTC合约类型欧式看涨期权计价单位USDT最小价格单位0.0001USDT合约比例1000:1.

USD:鼓捣币:昨晚到底发生了什么,美股巨震波及全球资本市场_USDT

北京时间12月4日消息,美股市场在12月的前两个交易日持续下跌,投资者情绪低落,感觉就像历史重演。美股已经连续三个交易日收跌,市场避险情绪急速升温.

TPS:关于币团上线BGCD公告_HTT

尊敬的币团用户: 币团交易所即将上线BGCD,开放BGCD/USDT的交易市场,具体时间如下:BGCD开放充提:11月29日18:00BGCD开放交易:11月30日15:00BGCD泛娱链.