机器学习之“小样本学习”,可应用于证券择时场景
由ftkj2018创建,最终由ftkj2018 被浏览 40 用户
小样本学习(Few-Shot Learning,FSL)是一种新颖的机器学习方法,旨在从少量的标记数据中学习。
深度神经网络在大数据上取得了骄人的成绩,但在仅有少量样本时表现得不尽如人意,而在很多实际情况中,数据难以取样或大量累积。为解决问题,小样本学习越来越受关注。
机器学习是从数据中学习,使完成任务的表现越来越好,而小样本学习则是具有有限监督数据的机器学习。
近年来,各种机器学习方法己被广泛应用到金融时间序列预测方面。这些方法往往是基于历史大样本数据进行训练,且假设训练样本和预测样本的分布是一致的。但股市分布并不稳定,在不同时间段,分布也不同。
为避免股市数据分布变化的问题,一个有效的方法是基于近期数据训练模型 (增加权重)。而近期数据样本量较少,模型容易欠拟合。则基于数据增强的小样本学习方法可对训练数据进行扩充,使机器学习模型尽可能收敛。
择时策略,量化投资策略之一,通过对未来市场走势的判断,增加或减少某一特定资产仓位的投资策略。目的是通过对未来走势判断,改变持仓仓位,从而获取超额收益。
数据增强是实现小样本学习的方法之一,一种对数据集规模进行扩充的行之有效的办法。由于数据增强的存在,数据的规模更大,质量也越高,使网络模型可具备更强大的泛化能力。在数据量不足情况下,可训练一个生成对抗网络(GAN) ,通过学习过程给小样本数据集加上扰动来生成新样本,从而达到扩充数据的目的。