研报&论文

华泰人工智能系列之十五:人工智能选股之卷积神经网络-华泰证券-20190213

由qxiao创建,最终由qxiao 被浏览 201 用户

摘要

卷积神经网络引领深度学习的发展,能够运用于多因子选股

卷积神经网络(CNN)是目前最为成熟的深度学习模型,是近年来人工智能蓬勃发展的重要推手之一,其主要特点是通过卷积和池化操作进行自动的特征提取和特征降维。本文首先通过原理分析给出了CNN运用于多因子选股的经验方法;然后在全A股票池内对CNN的预测结果进行单因子测试,其单因子测试结果相比对比模型具有良好表现;本文还构建了行业、市值中性全A选股策略并进行回测,CNN在以中证500为基准的全A选股测试中相比对比模型表现优秀。

本文通过原理分析总结了卷积神经网络运用于多因子选股的经验方法

将卷积神经网络运用于多因子选股时,通过分析其工作原理,我们总结出以下经验:(1)股票因子数据可以组织成二维的“图片”形式,这使得CNN具有了时间序列学习的能力。(2)当卷积核作用于股票因子数据时,本质上是在进行因子合成,因此本文只使用了一层卷积层。(3)池化层是对因子数据的“模糊化”,这对体现因子的明确意义是不利的,因此本文未使用池化层。(4)因子数据在“图片”中的排列顺序会影响到CNN的学习结果。

卷积神经网络合成因子的单因子测试具有良好表现

我们构建了卷积神经网络、全连接神经网络、线性回归三个模型,在2011-01-31至2019-1-31的回测区间中分年度进行训练和测试,样本空间为全A股。从单因子测试的角度来看,CNN合成因子的RankIC均值为13.62%,因子收益率均值为1.021%,略高于全连接神经网络,也要高于线性回归。在分五层测试中,CNN合成因子的TOP组合年化收益率为20.05%,夏普比率为0.72,信息比率为4.04,多空组合的夏普比率为4.84,表现都要优于全连接神经网络和线性回归。

卷积神经网络在以中证500为基准的全A选股测试中表现优秀

基于卷积神经网络、全连接神经网络和线性回归,我们构建了行业、市值中性全A选股策略并进行回测。在2011-01-31至2019-1-31的回测区间中,当以沪深300为基准时,两种神经网络在年化超额收益率、信息比率和Calmar比率上的表现都不如线性回归。当以中证500为基准时,CNN的年化超额收益在13.69%~16.38%之间,超额收益最大回撤在4.80%~7.55%之间,信息比率在2.29~2.56之间,Calmer比率在2.16~2.85之间,CNN在以上各项指标上的表现都优于另外两个模型,全连接神经网络略优于线性回归。

卷积神经网络仍有进一步研究的空间

随着ImageNet旗下的大规模视觉识别挑战赛(ILSVRC)连续数年的推动,卷积神经网络正在日新月异地进步中,还有诸多技术值得我们学习和尝试,例如增大训练样本数量的“数据增强”方法;ResNet中的残差学习方法;Inception网络中的多种尺寸卷积核混合的方法等等。此外,在高频、海量的金融数据中使用CNN也是一个值得尝试的方向。

正文

/wiki/static/upload/5f/5ffa1d9c-e066-4a6f-93b3-ebb485eb65b3.pdf

\

标签

深度学习多因子选股特征提取人工智能
{link}