华泰人工智能系列之三十四：再探_AlphaNet，结构和特征优化 (副本)

由sztuwhr创建，最终由sztuwhr更新于2022-09-21 07:39 被浏览 58 用户

摘要

本文从网络结构和特征优化的角度改进AlphaNet，回测表现更好

华泰金工前期报告《AlphaNet：因子挖掘神经网络》(2020.6.14)提出了AlphaNet-v1模型，能以端到端的方式有效提取股票原始量价数据中的因子。然而AlphaNet-v1在2019年下半年后表现欠佳，针对该问题，我们分别从神经网络结构和特征的角度进行改进，构建了AlphaNet-v2和AlphaNet-v3两个升级模型，并在多个股票池内测试。结果显示，在全A股和中证800成分股中AlphaNet-v2表现优于AlphaNet-v1，在中证500成分股中AlphaNet-v3表现小幅优于AlphaNet-v2。另外，本文总结对比了“遗传规划+随机森林”模型和AlphaNet的优缺点。

本文介绍了两个改进模型：AlphaNet-v2和AlphaNet-v3的改进思路

相比AlphaNet-v1，AlphaNet-v2改进了以下几点：(1)考虑到比率类特征的有效性，扩充了6个比率类特征；(2)将池化层和全连接层替换为LSTM层，从而更好地学习特征的时序信息；(3)训练集和验证集划分从1：1变成4：1，验证集更关注近期样本的表现。相比AlphaNet-v2，AlphaNet-v3改进了以下几点：(1)扩充特征提取层，特征提取层1和特征提取层2中的运算函数具有不同的回看区间(10和5)；(2)将LSTM层替换为GRU，减少模型参数。

在全A股和中证800成分股中，AlphaNet-v2表现优于AlphaNet-v1

设定回测期为20110131～20200731，调仓周期为10个交易日。在全A股中，AlphaNet-v2相比AlphaNet-v1的RankIC均值从9.72%提升至10.76%，ICIR从1.00提升至1.15。构建相对于中证500 的行业、市值中性的全A 选股策略，年化超额收益率从17.17%提升至19.09%，信息比率从2.73提升至3.13。在中证800成分股中，AlphaNet-v2相比AlphaNet-v1的RankIC均值从8.37%提升至8.63%，ICIR从0.73提升至0.75。构建相对于中证800的行业、市值中性的选股策略，年化超额收益率从6.19%提升至7.84%，信息比率从1.65提升至2.00。

在中证500成分股中，AlphaNet-v3表现小幅优于AlphaNet-v2

设定回测期为20110131～20200731，调仓周期为10个交易日。在中证500成分股中，AlphaNet-v3相比AlphaNet-v2的RankIC均值从9.05%提升至9.70%，ICIR从0.89提升至1.00。构建相对于中证500的行业、市值中性的选股策略，年化超额收益率从9.40%提升至9.75%，信息比率从2.19提升至2.30。

本文总结对比了AlphaNet和“遗传规划+随机森林”模型的优缺点

AlphaNet和“遗传规划+随机森林”模型都是基于量价数据的人工智能选股模型，本文对比了二者的优缺点。AlphaNet的优点是：端到端学习使得因子挖掘和因子合成使用同一目标函数进行优化，且无需维护因子池，从而无需做大量的单因子测试、因子相关性分析、因子中性化等工作。另外，只需按情况对网络结构做一定调整，就可针对任意的股票池、预测周期、数据频率构建预测模型，省时省力。AlphaNet的缺点是：模型可解释性较低，目前可嵌入神经网络的特征提取层还比较有限，没有覆盖遗传规划中全部因子计算函数。“遗传规划+随机森林”模型的优缺点则正好相反。

正文

/wiki/static/upload/ad/ad8c0234-69ca-4585-8c07-b8b343dad09a.pdf