2022年6月3日 端午节安康。
今天主要分享如何利用爬虫爬取区块链浏览器上的交易列表数据。
dune上没有bsc链上的转账明细数据表。Footprint Analytics上现有的bsc_transactions表transfer_type粒度不够。
python 3.7
数据存储:mysql 5.7
缓存:redis 6.2.6
开发工具:pycharm
(1)所有协议、合约、swap地址转账信息全爬不太实际,对存储要求比较高。所以针对需要分析的协议,专门去爬取对应智能合约转账是个不错的选择。
(2)区块链浏览器肯定是有反爬机制的。所以在代理选择上,要选择国外的代理。国内的代理都访问不到,具体原因你懂的。本文中不涉及代理部分,因为国外的代理厂家之前没有了解过。不过即使是上代理,对代码层面改动也比较小
(3)采用了urllib同步请求 + 范围内随机时长程序休眠。减少了被风控的概率。但是也降低了爬虫的效率。
后面再研究用scrapy或异步请求
同步:请求发送后,需要接受到返回的消息后,才进行下一次发送。异步:不需要等接收到返回的消息。
ETC Labs 将与 Chainsafe 合作推出 ETC 跨链资产 rETC:ETC Labs 将与 Chainsafe 合作于下月推出跨链资产 rETC。持有 ETC 资产的用户可以在以太坊经典区块链上通过智能合约锁定其资产,而在以太坊区块链上得到对应资产 rETC,然后通过 rETC 参与 ETH 生态项目。[2020/10/30 11:14:44]
找到需要爬取合约的具体地址:
第一页
http://bscscan.com/txs?a=0xbd3bd95529e0784ad973fd14928eedf3678cfad8第二页
https://bscscan.com/txs?a=0xbd3bd95529e0784ad973fd14928eedf3678cfad8&p=2第三页
https://bscscan.com/txs?a=0xbd3bd95529e0784ad973fd14928eedf3678cfad8&p=3....
可以知道 p = ?就代表页数。
然后F12 点击“网络”,刷新界面,查看网络请求信息。
主要查看,网页上显示的数据,是哪个文件响应的。以什么方式响应的,请求方法是什么
如何验证呢,就是找一个txn_hash在响应的数据里面按ctrl + f去搜索,搜索到了说明肯定是这个文件返回的。
查看响应的数据,是html的格式。在python里面,处理html数据,个人常用的是xpath(当然,如果更擅长BeautifulSoup也可以)
在python里面安装相关的依赖
pip install lxml ‐i https://pypi.douban.com/simple同时在浏览器上安装xpath插件,它能更好的帮助我们获到网页中元素的位置
XPath Helper - Chrome 网上应用店 (google.com)
然后就可以通过插件去定位了,返回的结果是list
**注:**浏览器看到的网页都是浏览器帮我们渲染好的。存在在浏览器中能定位到数据,但是代码中取不到值的情况,这时候可以通过鼠标右键-查看网页源码,然后搜索实现
然后就是利用redis,对txn_hash去重,去重的原因是防止一条数据被爬到了多次
最后一个需要考虑的问题:交易是在增量了,也就是说,当前第二页的数据,很可能过会就到第三页去了。对此我的策略是不管页数的变动。一直往下爬。全量爬完了,再从第一页爬新增加的交易。直到遇到第一次全量爬取的txn_hash
最后就是存入到数据库了。这个没啥好说的。
以上就可以拿到转账列表中的txn_hash,后面还要写一个爬虫深入列表里面,通过txn_hash去爬取详情页面的信息。这个就下个文章再说,代码还没写完。
今天就写到这里。拜拜ヾ(?ω?`)o
来源:Bress
作者:撒酒狂歌
继加密货币Luna在价值近乎归零后,加密货币市场又一次引起关注,这次是币圈热门“跑鞋”项目STEPN。 5月27日,STEPN突然宣布清退大陆用户,引发项目代币GMT和GST价格跳水,一度跌幅近40%。不过,随着市场情绪有所缓和,截至记者发稿时,两个代币价格有所回升。
加密货币和稳定币没落之后,NFT 会发生什么? 什么将推动 NFT 强势回归。 不可替代代币(NFT)的批评者长期以来一直警告说,当前的NFT狂热是暂时的。目前,有越来越多的证据支持他们的说法。 根据市场追踪机构 NonFungible的说法,不可替代代币的典型购买价格现在不到 2,000 美元。这比 1 月份大约 6,800 美元的总额有所减少。
原文标题:《30 Token Design and Launch Questions》 如果把加密货币比作 web2 世界中的网站,那么 SEO 和可搜索性就是通过流动性池和做市实现这些代币的无缝分配。 现在代币经济学的设计非常热门。我参与了一些非常有趣且具有挑战性的代币设计项目。设计代币的艺术比常规网站更小众、更复杂。
本文来自可信区块链推进计划发布的《基于区块链的数字藏品研究报告》第三章:基于区块链的数字藏品技术路线。区块链数字藏品的技术原理,包括表达、接口、语义、应用链路等内容,与存证类区块链技术、同质化凭证也存在很多区别。 以下摘自报告原文。
互联网在发展中世界的迅速发展对世界上贫穷国家人民的生活方式产生了明显的影响。 由于互联网的连接,数百万人摆脱了贫困,获得了更好的教育机会。网络的传播简化了交流的过程,并帮助提高了作物的生产力和参与度,从而改善了生活条件。 互联网的影响确实是全球性的。截止2022年4月,世界超过63%的人口开始使用互联网。
实践中,我们发现从业者对普法类文章有偏爱,今天咱们满足大家的诉求。我们要与诸位分享NFT数字藏品无法绕开的《著作权法》中几个基本法律常识,也是实务里经常被“顾名思义”误导的知识。期待给大家行为边界,让朋友们在法律框定范围内做适当创新。也许,我们今天的结论有些“开脑洞”,且听分解。