区块见闻 区块见闻
Ctrl+D收藏区块见闻
首页 > Luna > 正文

机器学习能否预测加密货币的价格?

作者:

时间:

这份实用指南提供了你预测加密货币价格飞速上涨所需的基础知识。

十五年前,我开始探索数字货币的世界,并为一个只使用短信的点对点移动货币平台做了原型。

最近,我的一位合作者问我,人工智能是否可以预测加密货币的价格。她对区块链的炒作很好奇。

经过研究,我发现预测加密货币价格是一个可以解决的问题,但绝对不是针对所有市场条件。

加密资产的典型预测模型将利用时间序列预测(如ARIMA、Facebook Prophet)、机器学习(如随机森林算法、线性回归)或深度学习方法(如LSTM)。

在本文中,我研究了在预测给定日期的Litecoin平均价格时,片断插值的表现如何。

我们将关注2013年4月至2021年2月期间Litecoin的历史价格。这些数据取自coinmarketcap,并且是可以免费使用的。我将数据分为80%的训练数据集和20%的测试数据集。后者用于评估我们预测收盘价的准确性。

加密货币Litecoin的价格历史 (Source: Kaggle)

短暂的探索性数据分析显示,平均收盘价在年初和年末是最高的。10月份最低。

数据:当前比特币市值占比为46.67%:金色财经消息,据CoinMarketCap最新数据显示,当前比特币市值占比为46%,以太坊市值占比为17.1%。[2022/6/11 4:18:06]

你可能听说过多项式回归,这可以说是创建一个阶数为d的基础来近似一个非线性函数(在我们的例子中,加密货币价格波动)的最简单例子。

我对Litecoin的历史价格进行了简单的多项式回归,使用5、25和80的阶数。在每种情况下,R2值将提供一些关于模型在测试数据集上的拟合度好坏的信息。

从下面的蓝线与训练数据的拟合度来看,我们可以观察到随着多项式阶数的增加,曲线越来越陡峭。这是由于模型复杂性增加,因为高阶多项式试图追逐训练集中的每一个单一数据点。

第0天代表2013年4月30日,第2800天代表2021年2月28日。

Ransomwhere正在跟踪总额超过 5750 万美元的加密货币付款赎金:一位前美国政府网络安全研究员推出了一个众包勒索软件支付跟踪网站,可用于追踪以比特币加密货币支付给犯罪分子的赎金,该网站名为Ransomwhere。Ransomwhere 正在发布有关支付给犯罪分子的金额以及他们使用的比特币地址的数据,目前,该网站正在跟踪总额超过 5750 万美元的付款。(iTnews)[2021/7/9 0:38:48]

特别是在有离群值的区域(图的中间部分),高阶多项式往往会向这些离群值的方向发展。因此,80阶多项式的模型具有最高的方差。

它在训练数据上的偏差也是最低的,这体现在最高的R2值上,相比之下,低阶多项式的R2更低,意味着更高的偏差但更低的方差。低阶多项式对训练数据的敏感性较低。

我发现一个更灵活的方法是使用片断多项式来预测加密货币价格。

分片插值用低阶多项式拟合大量的数据点。由于我们只使用低阶多项式,我们消除了过度的振荡和非收敛性。

新浪科技:京东售后疑似出售客户返修显卡致穿仓:有用户表示,京东将客户返修的显卡高价卖出,等显卡价格下降之后再买回还给客户。然而近期以太坊价格不断新高,导致显卡价格不降反升。目前,显卡有价无市,京东售后无法低价买回显卡。部分用户表示,京东试图以原价对二手市场价格已经翻倍的显卡进行退款。(新浪科技)[2021/5/6 21:29:35]

给定一组数据点,分片插值的工作原理是在每一部分数据中使用不同的多项式。

特别是,我们使用连接的分片多项式,也称为样条。

样条的一个例子是下面的截断线性函数。它在4的左边是平的,称为函数的结。

给定几个结点,我们可以将多个线性基函数组合起来,并将其拟合到非线性数据中。

为了检测加密货币价格中存在的高度曲线关系,我使用了一个截断的三次函数,也叫三次样条。

使用三次样条,我们将数据分割成块,并对每个块拟合一个三次样条。每个样条函数在结点处连接到下一个函数。

三次样条是加密货币价格变化的一个非常好的选择,因为连接是平滑的。三次样条的斜率和它们的第一和第二导数都是匹配的。三次样条是3阶的多项式函数,它仍然足够小,以避免差异性。

三次B-样条是三次样条的一个更容易的变体,用于高效计算,因为最多有5个基函数参与贡献插值。下面我们可以看到三次B-样条在Litecoin价格上的表现,将结点放在四分位数上之后。

通过手动选择结点,即在我们有一堆数据点的情况下,与根据四分位数放置结点时的值相比,我们在测试数据集上实现了更好的R2。

在边界附近的三次样条可能表现得很奇怪,你能够在上面的红色图中注意到。所谓的自然三次样条通过在每个极限处将一个三次多项式改为线性来强制要求函数在极限结点之外是线性的。

自然三次样条需要选择一个自由度。对于Litecoin的价格,我通过交叉验证找到了最佳自由度:挑选了合适的174个结点的量子作为预测器的日期。结果与三次B-样条相比,边缘的差异性更小,但测试数据集的R2略差。

最后,我实现了平滑样条,在惩罚价格变化的同时,使均方误差最小化。

平滑样条似乎是Litecoin价格最合适的分片插值。该模型在测试数据集上实现了迄今为止获得的最佳R2值。

三次样条模型令人兴奋的部分是如何超越用于训练模型的数据范围进行推断。

根据以预测和时间序列工作而闻名的著名统计学家Rob Jhyndman的说法,三次平滑样条模型在预测方面可以作为与ARIMA模型等效的模型,但其参数空间受到限制。Rob声称,样条模型提供了一个平滑的历史趋势以及线性预测函数。

我邀请你进一步试验这个想法。我的计算机代码可以在网上以Jupyter Python/R Notebook形式查看。

本文中使用的Google Colab Notebook 

数字货币和加密货币,如Litecoin,是现代全球经济中最具争议和最复杂的技术创新。本文旨在使用一种不太流行的方法:三次样条来预测Litecoin价格的变化。

Michel Kana, Ph.D   作者

Jeremy   翻译

Jeremy   编辑

标签:NFTOPENENS加密货币Musician Worlds NFTOpenSeaetherdimension加密货币市场总市值排名

Luna热门资讯
DeFi重燃公链赛道战火 Conflux生态以巧破力强势突围

2021开年以来,加密货币市场的行情可谓是跌宕起伏,数次快速上涨突破历史新高的同时,也伴随着大幅下跌,创下了去年312以来最大的跌幅和爆仓量,为今年的牛市蒙上了一层阴影。然而行情的大幅波动并没有影响加密金融生态的发展壮大,尤其是DeFi金融生态体系的建立,为加密市场提供了更具价值的底层支撑。

金色DeFi日报 | DeFi去中心化金融基准利率今日为14.7%

DeFi数据 1.DeFi总市值:1091.08亿美元 市值前十币种排名数据来源DeFibox DeFi总市值数据来源:Coingecko 2.过去24小时去中心化交易所的交易量:29.7亿美元 过去24小时去中心化交易所的交易量数据来源:Debank 交易量排名前十的DEX 排名来源:DeFibox 3.DeFi借贷平台借款总量:151。

十七个非同质化代币(NFT)最常见问题汇总

问题一:什么是非同质化代币(NFT)? 问题二:NFT 有哪些特点? 问题三:为什么要拥有 NFT? 问题四:如何购买 NFT? 问题五:如何参与 NFT 流动性挖矿? 问题六:如何确定购买的 NFT 是真品? 问题七:NFT 是最新出现的吗? 问题八:NFT 有哪些应用场景? 问题九:NFT 在游戏领域中有什么具体用例吗? 问题十:如何购买 NFT。

1年200倍、空降Top10 THETA究竟是什么来路?

说起近期表现突出的那些“黑马 Token” ,Theta 可以算是其中一个。今年 3 月 2 日,Theta Network 官方曾在推特上宣布 Theta 主网 3.0 将于 4 月 21 日发布。 尽管近期又称会推迟到 6 月 30 日,但这个消息放出以后,让很多已经知晓Theta 在 2020 年已经有不俗表现的投资者蠢蠢欲动。

如何摧毁比特币网络:空块攻击、51%算力攻击?

原标题:如何摧毁比特币网络 比特币评论家在讨论比特币系统可能瘫痪的种种可能时,付出的努力足以让人们感到惊讶。但,很少有人会拿美元的缺点来作为案例进行解读,这些‘观点’对污名化比特币,有着深远的影响。他们用过去的那些对比特币千篇一律的“担忧”,来“警告”人们要远离比特币。

波卡:回答关于验证人和平行链的 11 个问题

本文整理自波卡官方文档 Polkadot Wiki,主要是对于波卡验证人和平行链相关问题的一些回答。本文由波卡第一中文社区 PolkaWorld 翻译。 网络安全性与连接到 Polkadot 中继链的平行链的数量无关,但是与验证人的数量相关。因为验证人的数量越多,网络的去中心化特性就越强,也就越难被攻击。