变分自编码器:金融间序的降维与指标构建(附

时间:2019-10-09

  本文探讨了使用一个变分自动编码器来降低使用Keras和Python的金融时间序列的维度。我们将进一步检测不同市场中的金融工具之间的相似性,并将使用获得的结果构建一个自定义指数。

  为了比较各种价格区间的时间序列,我们选择计算收益的几何移动平均时间序列,定义如下:

  本文使用的数据集包含从2016年1月4日到2019年3月1日期间的423个几何移动平均时间序列。

  然后,刚刚构建的dataframe可以分为两个等长的时间段,仅在第一阶段内转置一个。第1阶段从2016年1月12日到2017年8月4日。第2阶段从2017年8月7日到2019年3月1日。马会开2018年开奖结果

  我们将使用随机模拟来生成合成的几何移动平均曲线。目标不是精确地建模返回,而是获得具有类似于真实数据的行为的曲线。通过仅使用模拟曲线训练模型,我们可以保留真实的数据来获得预测。

  我们已将423个时间序列的数据集扩展为100 * 100 = 10,000个与股票数据集相似(但不相等)的新时间序列。

  在构建变分自动编码器(VAE)模型之前,创建训练和测试集(使用80%-20%的比率):

  我们将使用变分自动编码器将具有388个项目的时间序列向量的维度降低到二维点。

  自动编码器是用于压缩数据的无监督算法。它们是由一个编码器、一个解码器和一个丢失函数构成,用于测量压缩和解压缩数据表示之间的信息丢失。

  我们将只使用编码器来获取预测。我们将使用实值矩阵,中央纪委国家监委网站通报八起“四风”问题典,包括股票数据集和一个或多个感兴趣的时间序列。

  在我们的项目中,我们针对在另一个国家以不同货币所列出的前一个月期货合约测试了一个股票数据集。

  我们已经对另一个国家所列出的期货合约进行了分析,但是对于来自于同一交易所的股

  由于VAE模型的随机性,我们将无法获得每次运行的前50只股票的准确列表。为了得到最接近50个点的公平表示,我们将运行VAE模型(每次运行时重新初始化和重新训练)。然后,我们将在每次运行中找到的50个最近点,以创建一个长度为500的dataframe closest_points_df。

  相反,我们将计算每只股票的权重,使得最接近期货合约点的点将比离它较远的点获得更高的权重。

  对于非匿名股票数据,在计算股票权重之前,对得到的结果进行过滤是非常重要的。应删除异常值并改进市值范围。

  为了建造指标,我们将使用拉斯拜尔指数(Laspeyresindex),计算如下:

  我们必须缩放期货价格数据,以便将其绘制在与我们自定义指标相同的图表中。要做到这一点,我们必须:

  除2018年下半年外,我们的指数与参考期货时间序列的趋势大致相同。因为我们使用匿名数据,所以我们没有过滤股票的异常值和市值限制。此外,在观察到的两个时间段内没有重新平衡,并且我们忽略了分布。

  我们鼓励大家利用在线提供的免费(GPU)实例创建自己的指标。这对我们来说是一个有趣的实验,我们发现了一些有趣的股票模式。

  使用变分自动编码器可以加快外国股票市场新指数的发展,即使分析师不熟悉它们。此外,还可以创建符合客户利益的利基指数或投资组合。

  虽然这种方法可以用于创建ETF,但我们相信它也可以为全球的直接指数和智能投顾公司创造新的投资可能性。


友情链接:
Copyright 2018-2021 香港马会内部资料 版权所有,未经授权,禁止转载。
本港台同步现场报码| 香港马会开奖现场直播| 香港最快开奖现场直播| www.620222.com| kj888.com| www.378744.com| 1230303马会| 同福心心水论坛001888| 香港跑狗图库| www.83945.com| 香港赛马会| 天下彩|