精华帖子

基于深度学习的指数增强策略

由bq20kttn创建,最终由bq20kttn 被浏览 58 用户

在投资领域,指数增强策略作为被动投资与主动投资的有机结合体,既延续了指数基金对基准的紧密跟踪,又通过主动管理寻求超额收益,成为市场中备受关注的投资方向。如今量化方法已经成为指数增强的主流选择,其中多因子模型应用广泛,但随着金融数据的爆发式增长和算法技术的迭代,深度学习凭借其强大的特征挖掘与非线性拟合能力,为指数增强策略的升级提供了新的可能。本文将结合指数增强的核心逻辑,详细介绍基于深度学习(DNN)的沪深 300 指数增强策略构建与实现。

一、指数增强介绍

多因子模型是目前管理较大规模量化产品的主流方法,是量化选股方法中理论体系最丰富的模型之一。多因子模型是由套利定价模型(APT)发展而来的,是对于风险—收益关系的定量表达,不同因子代表不同风险类型的解释变量。多因子模型定量刻画了股票预期收益率与股票在每个因子上的因子载荷(风险敞口),以及每个因子每单位因子载荷(风险敞口)的因子收益率之间的线性关系,其一般表达式为:

其中,rj​ 为股票j的收益率,Xjk​ 为股票j在因子k上的暴露度(因子载荷),f~​k​ 为因子k的收益率,u~j​ 为股票j的残差收益率。

这一模型的核心优势在于,将对N只股票的收益 - 风险预测,转化为对K个因子(K≪N)的预测,简化了协方差矩阵的估算难度,同时通过控制组合在风险因子上的暴露,实现对跟踪误差的科学管控。

完整的多因子指数增强策略需经历 “因子筛选 — 收益预测 — 风险预测 — 组合优化” 四步闭环:

  1. 因子筛选:通过单因子测试验证因子的有效性,剔除冗余或失效因子,构建稳定的因子库;
  2. 收益预测:采用打分法(静态权重)或回归法(动态权重),结合个股在各因子上的暴露度,预测个股未来收益;
  3. 风险预测:参考 Barra 等成熟风险模型,估算个股及组合在各类风险因子上的暴露度与协方差矩阵;
  4. 组合优化:以 “预期收益 - 风险惩罚项” 为目标函数,加入行业中性、风格中性、个股权重上限等约束条件,通过线性规划或二次优化确定最终组合权重。

二、策略逻辑与流程

首先,为了更好地理解指数增强的策略框架,在保证风险因子上的暴露与基准指数一致的问题上,我们暂时只考虑行业和市值。因为只有两个风险因子,我们可以直接用分层抽样的方法就可以实现风险中性。分层抽样策略的精髓就是使投资组合在这两个风险维度上与基准指数保持一致,在市值、行业属性比较相似的若干只股票里优选一只预期收益最高的进行投资,获取超额收益。

接下来描述策略细节步骤。首先,将基准指数成份股按申万一级行业划分成31个子集,在每 个子集中用市值因子将股票划分为数目相等的三组,并计算每个小组内所有股票在基准指数中的总权重。接下来,在每个小组中选择预期收益最高的一只股票,令它在投资组合中的权重等于它所处小组的权重。这样就能选出包含目标分层抽样组合。

在预测预期收益时,较为简单的方法是打分法,即将各因子去极值、中性化、标准化后,等权相加作为股票未来收益的预测值。但这种方法的对收益预测的精度肯定相当受限,我们在这里引入DNN深度学习模型来帮助我们预测股票未来收益,关于DNN深度学习模型的介绍见基于DNN深度学习网络的选股策略

保持训练四年,测试一年的做法,本文以2021年至2024年为训练期,构建了多维度特征(包括 5 日内的价格序列、成交量与换手率指标、滚动统计特征、排名特征、衰减线性特征以及多变量相关性特征),通过DNN模型来预测个股未来 20 日收益率,测试集为2025年1月1日至2025年12月31日,换仓周期为20天。

本文首先选取的基准是沪深300指数,因为分行业股票数量参差不齐,添加条件:如果行业股票数小于3,不做选股;如果行业股票数大于等于3,小于6,不做市值分组,直接选择预期收益最高的股票。为了控制单票在组合中的权重,还设置最高权重不能超过5%。

三、回测结果

沪深300指数2025年的增强效果,可以看到收益情况并没有很显著,但是策略跟踪效果还不错:\n

更换为中证500指数后,下面是2025年的增强效果,相比于基准收益有小幅提升,指数跟踪的效果仍然非常好:

下面把基准更换为中证1000指数的增强效果


策略源码:https://bigquant.com/square/ai/9de54d7b-9f4d-7485-3687-1fc34e810e18





\

标签

深度学习
{link}