华泰人工智能系列之三十四:再探_AlphaNet,结构和特征优化
由kyrie_fu创建,最终由kyrie_fu 被浏览 112 用户
摘要
本文从网络结构和特征优化的角度改进AlphaNet,回测表现更好
华泰金工前期报告《AlphaNet:因子挖掘神经网络》(2020.6.14)提出了AlphaNet-v1模型,能以端到端的方式有效提取股票原始量价数据中的因子。然而AlphaNet-v1在2019年下半年之后表现欠佳,针对该问题,我们分别从神经网络结构和特征的角度进行改进,构建了AlphaNet-v2和AlphaNet-v3两个升级模型,并在多个股票池内测试。结果显示,在全A股和中证800成分股中AlphaNet-v2表现优于AlphaNet-v1,在中证500成分股中AlphaNet-v3表现小幅优于AlphaNet-v2。另外,本文总结对比了“遗传规划+随机森林”模型和AlphaNet的优缺点。
本文介绍了两个改进模型:AlphaNet-v2和AlphaNet-v3的改进思路
相比AlphaNet-v1,AlphaNet-v2改进了以下几点:(1)考虑到比率类特征的有效性,扩充了6个比率类特征;(2)将池化层和全连接层替换为LSTM层,从而更好地学习特征的时序信息;(3)训练集和验证集划分从1:1变成4:1,验证集更关注近期样本的表现。相比AlphaNet-v2,AlphaNet-v3改进了以下几点:(1)扩充特征提取层,特征提取层1和特征提取层2中的运算函数具有不同的回看区间(10和5);(2)将LSTM层替换为GRU,减少模型参数。
在全A股和中证800成分股中,AlphaNet-v2表现优于AlphaNet-v1
设定回测期为20110131~20200731,调仓周期为10个交易日。在全A股中,AlphaNet-v2相比AlphaNet-v1的RankIC均值从9.72%提升至10.76%,ICIR从1.00提升至1.15。构建相对于中证500 的行业、市值中性的全A 选股策略,年化超额收益率从17.17%提升至19.09%,信息比率从2.73提升至3.13。在中证800成分股中,AlphaNet-v2相比AlphaNet-v1的RankIC均值从8.37%提升至8.63%,ICIR从0.73提升至0.75。构建相对于中证800的行业、市值中性的选股策略,年化超额收益率从6.19%提升至7.84%,信息比率从1.65提升至2.00。
在中证500成分股中,AlphaNet-v3表现小幅优于AlphaNet-v2
设定回测期为20110131~20200731,调仓周期为10个交易日。在中证500成分股中,AlphaNet-v3相比AlphaNet-v2的RankIC均值从9.05%提升至9.70%,ICIR从0.89提升至1.00。构建相对于中证500的行业、市值中性的选股策略,年化超额收益率从9.40%提升至9.75%,信息比率从2.19提升至2.30。
本文总结对比了AlphaNet和“遗传规划+随机森林”模型的优缺点
AlphaNet和“遗传规划+随机森林”模型都是基于量价数据的人工智能选股模型,本文对比了二者的优缺点。AlphaNet的优点是:端到端学习使得因子挖掘和因子合成使用同一目标函数进行优化,且无需维护因子池,从而无需做大量的单因子测试、因子相关性分析、因子中性化等工作。另外,只需按情况对网络结构做一定调整,就可针对任意的股票池、预测周期、数据频率构建预测模型,省时省力。AlphaNet的缺点是:模型可解释性较低,目前可嵌入神经网络的特征提取层还比较有限,没有覆盖遗传规划中全部因子计算函数。“遗传规划+随机森林”模型的优缺点则正好相反。
正文
/wiki/static/upload/ad/ad8c0234-69ca-4585-8c07-b8b343dad09a.pdf
\