个股alpha与行业beta的双剑合璧-华安金工-20221122
由small_q创建,最终由small_q 被浏览 84 用户
主要观点
本篇报告从最大化选股策略效益的角度,将个股评价与行业评价进行耦合,构建个股alpha与行业beta双驱选股策略。
将个股alpha和行业beta相结合具有实践意义
投资收益的来源包含alpha和beta,理论上,我们希望alpha和beta收益都高,但在实践中,尤其是量化研究领域,我们一般解决的是“挖alpha”或“追beta”的问题,并不能将两者有效兼顾。一方面,A股的行业效应不可忽视,且pure alpha日渐稀缺;另一方面,个股周期与行业周期并不完全同步,个股的内生特性也值得深挖。因此,本文尝试综合权衡个股内生性与行业属性,将个股评价与行业评价进行耦合,在此基础上构建alpha与beta双驱选股策略。
构建动态平衡个股和行业的耦合模型,挖alpha与追beta,双管齐下
通过个股相对行业的弹性β构建了动态权衡个股和行业的耦合模型,模型通过β来权衡个股自身特性和行业的影响权重。然后,通过实例论证将个股与行业通过耦合模型相结合的有效性,先后构建了基于盈利、估值、技术面的三维个股评价策略 (alpha),基于资金面和分析师预期的行业评价策略(beta),最后通过耦合模型将两个并行策略结合构造alpha与beta双驱选股策略。
个股alpha策略与行业beta策略相得益彰,组合权重优化锦上添花
实证表明,在个股alpha策略上耦合主动管理beta的行业轮动策略具有良好的协同效应,叠加后的双驱策略相较于原始的alpha策略,所有的收益指标均有所提升、风险指标均有所降低,风险收益比得到了有效提高。2013.1.1-2022.11.11,双驱策略优选50等权组合的年化收益为31.0%,相对中证800的年化超额24.9%,相较于原始的alpha策略,年化收益率提升了2.7%,夏普比率提高了0.11,调仓胜率提高了3%,盈亏比提升了0.2,最大回撤降低了4.5%,行业配置的收益均值从0.34提升至了0.56。在双驱策略构建的组合中,引入“最大化夏普”对组合个股权重优化后的表现得到了进一步提升,优化后50等权组合的年化收益32.5%,年化超额26.3%,夏普比率1.11。
挖alpha,追beta,双管齐下
投资的起点和终点都是取得投资收益,投资收益可拆分为alpha和beta,beta收益取决于市场、行业或风格趋势,alpha收益则是除上述beta收益后的超额收益,来源于个股选择或交易择时。从beta的构成看,由于A股做空成本较高,在不考虑仓位择时的情况,很难完全剥离市场beta,更多的可能是立足于行业或风格的beta。
从投资效益最大化的角度,我们希望alpha和beta收益都高,同时风险可控,但在实践中,尤其是量化研究领域,我们一般解决的是“挖alpha”或“追beta”,“选个股”或“选行业”的问题,并不能两者兼顾。从选股维度看,以多因子选股策略为例,我们以获取alpha为目的,在构建策略时,会对因子做行业市值中性化,对行业无偏好,不对风格进行完全剥离,即忽略行业beta。从选行业维度,认为行业配置是获取超额收益的重要来源,行业轮动目的是寻找大beta,是一种中观策略,不会深入研究行业内个股的差异性,即忽略个股alpha。
实际上,一方面,A股市场存在明显的行业效应,我们很难只关注个股的内生性而忽略行业周期的影响,每一个大牛股都有行业或时代的烙印;与此同时,在一个越来越有效的市场中,纯粹的、稳定的alpha日渐稀缺,也越来越“贵”,主动拥抱行业beta有助于拓宽投资道路。另一方面,当行业发展到一定时期,行业内个股的分化加剧,个股周期与行业周期并不完全同步,聚焦个股的内生性也是非常有必要的。
基于此,我们期望能有一种方法,兼顾选个股和选行业,在两者之间进行动态平衡,取长补短,使得我们的组合即能保护个股的内生性又能享受行业赋予的beta,最大化投资效益。目前,业内将两者结合的研究较少,有同行尝试用“行业轮动叠加因子选股”、“个股因子叠加行业因子选股”两种方法将个股和行业因素相结合。
行业轮动叠加因子选股:在beta里选alpha
“行业轮动叠加因子选股”法是“自上而下”的一种“串联”选股方法,研究路径为“行业-个股”,先通过行业轮动策略确定目标行业,然后在优选的目标行业基础上建模精选个股,个股精选包括分行业建模和通用建模两种方式。
在投资实践中,行业轮动叠加因子选股方法是“串联”选股逻辑,选行业和选个股具有较高的联动效应,这就要求选行业和选个股的双重准确性,不可避免的出现以下问题:
- 选行业”作为第一道关,关乎收益的第一步,但在结构性行情持续演绎的格局下,行业轮动的速度和准确性难以跟上行情的演绎,操作难度也极高。图表3为今年来30个中信一级行业的月度表现,1月至8月,月涨跌幅前2的行业的轮动过程是:银行/房地产→有色/煤炭→煤炭/房地产→消费者服务/食品饮料→汽车/石化→消费者服务/电新→汽车/机械→煤炭/石化,月度涨跌幅靠后的2个行业分别是军工/医药→家电/非银→电子/消费者服务→综合/电新→房地产/银行→公用事业/石化→消费者服务/食品饮料→汽车/电新。可见,无论是前2还是后2组合,轮动速度非常快,月度轮动的换手率接近100%;同一个行业在相邻几个月表现极端,先后出现在Top2和Bottom2。
为了更直观的体现今年行业轮动的极致程度,我们分别构建周频和月频的基于收益动量的行业轮动策略,买入上期表现最好的3个行业等权构成行业组合,策略截止2022.11.11。结果表明,不论周频还是月频策略,买入上期表现最好的3个行业构成的等权组合的表现都不理想,总收益分别为-27.3%和-28.0%,均为负,周度换手率83%,月度换手率85%,验证了行业轮动的速度和极致。首先,我们认为在8个月内,同一个行业的基本面较难出现“天地板”,在这样极端演绎的行情中,精准把握行业轮动的特征具有一定的挑战性。其次,当行业板块的轮动速度过快时,调仓的操作难度也较高,行业变了,就需要把这个行业的股票全部卖出,换仓幅度大,当产品达到了一定规模,调整起来难度高。
- “先选行业再选个股”容错率低,需要“精确的正确”,由于先圈定了目标行业,选股的股票池仅限入选的行业成分股,倘若选错行业,选股的胜率也将被大幅降低,形成一步错,步步错的局面。图表3的“Top1-Bottom1”行为月度行业最高收益率-最低收益率,可见行业间的分化严重,行业间的月度收益差的均值超20%。
我们做如下假设:国防军工为我们1月优选的目标行业,在95只成分股中,仅观想科技当月微幅收涨1.81%,成分股涨跌幅的中位数为-16.53%,由行业内表现前20%的个股等权构成的组合的收益率为-7.10%(同期沪深300 -7.62%),也就是说,如果我们第一步优选到了国防军工行业,然后在国防军工行业内优选20%个股作为组合,最好情况也仅仅是略微战胜了沪深300,整个策略的胜率由于第一步踏错,满盘皆输。相反,如果我们选对了行业,在真正的高beta行业中挑高alpha个股,组合会有较高的超额收益。这种选股策略的目标只能容忍“精确的正确”,组合分散度低,收益的波动性高。
- 低估低beta行业的高alpha个股,高估高beta行业中的低alpha个股。在行业轮动叠加因子选股框架下,我们先制定了行业筛选标准,一些不符合行业筛选标准的良好投资机会可能会被忽略,决策结果倾向于认为“行业优质、公司一般”优于“公司优质、行业一般”,实际上很多好公司未必出自于好行业中。图表6统计了今年来、上市超过3个月的月涨幅位于前300的股票的行业分布情况,统计表明,月度前300组合的行业分布较分散,并未出现在“好行业”扎堆的情况,超70%的个股分布在Top2行业之外,因此普通行业中的优质个股也值得我们深度挖掘。
- 策略构建的成本高。常用的“行业轮动叠加因子选股”流程冗长,待解决问题繁多,尤其是在第二步精选个股层面,我们通常有两种方式,分行业建模和通用建模,两种方式都有局限性。分行业建模,不但需考虑人力、物力、时间成本,还要考虑因细分行业样本量少导致模型准确性被降低的问题,以及不同行业的个股比较问题;通用模型,使用同一标准选出的个股,并没有行业的痕迹,行业的重要性怎么体现、行业暴露程度如何控制、同行业不同弹性的个股如何取舍等一系列问题需要解决。
个股因子叠加行业因子选股:alpha和beta一起选
“个股因子叠加行业因子选股”法是在传统的股票多因子的基础上增加行业因子以达到选股的目的。如下图,ri为股票i的预期收益率,Xi,k为股票i在股票因子k上的暴露(该股票的所对应的因子值),Yi,m为股票i在行业因子m上的暴露,fi表示第i只股票第k个因子的因子收益率(即每单位因子暴露所承载的收益率);ui表示第i只股票的特质因子收益率。一般行业因子和个股因子的类型应不同。相较于传统的个股多因子选股,增加了行业因子部分,若股票1和股票3同属一个行业,则其在行业因子部分的暴露相同。
在实际应用中,一般会对个股因子和行业因子进行聚类,形成“个股因子”和“行业因子”,在合成时,赋予各自权重,常用的方法为静态等权法,即_个股总得分=1/2行业因子得分+1/2个股因子得分_,但该方法存在一定偏差。究其原因,我们认为:
静态等权法认为行业因子对行业内所有个股的影响是相同的,但实际上不同个股对行业的弹性存在明显的差异,并不能一视同仁。我们定义个股弹性为个股相对行业的β系数,用个股和标的行业指数(中信一级)最近120日涨跌幅进行OLS回归,斜率即为个股相对行业的β系数。以电新行业为例,图表9为8月31日电新行业成分股对行业的β系数分布,可以看到行业内个股对行业的弹性存在明显分化,虽然呈现类对称分布,但高弹性个股占比略低于低弹性个股,说明少数个股对行业的牵引力强。图表10为宁德时代和大洋电机相对电新行业的β系数的时序图,宁德时代的弹性均值为1.3,长期处于高弹性状态,而大洋电机的均值仅0.55,长期处于低弹性状态。虽然两者都为细分赛道动力系统个股,但两者对行业整体的弹性存在明显的差别,由此可见,我们在分析行业因子对个股的影响时,并不能一视同仁。
若采用其他加权方式,如动态加权或不等权法,我们还是需要解决“行业因素”和“个股因素”的权重权衡问题,同时还要兼顾模型的可解释性、高实用性。
基于以上分析,我们尝试从量化选股视角出发,将个股评价和行业评价相耦合,构建个股alpha与行业beta双驱选股模型,力求在个股和行业中寻求动态平衡,让个股alpha和行业beta共同驱动投资。
个股评价和行业评价耦合模型初探
寻找alpha与beta的连接桥梁
我们的目的是找到一种耦合方式将“行业”和“公司”有机结合,让个股alpha和行业beta相辅相成,共同驱动投资收益。因此,我们试着从投资收益的来源出发,基于资产定价模型将收益拆解为个股alpha和行业beta,从中寻求衔接alpha与beta的灵感。
第一个关于金融资产定价的均衡模型由威廉·夏普提出的资本资产定价模型(CAPM),用于反映系统性风险与证券投资报酬关系,模型表达式为:
其中,
Rm是市场投资组合的收益率,Rp是投资组合的收益率,Rf为无风险资产收益率。
βpm是投资组合p相对市场组合的风险系数,|βpm|>1代表投资组合相对大盘的弹性更大,如果为负,则说明投资组合与大盘的波动方向相反。
(Rp)-Rf是风险投资组合相较于无风险资产高出的期望收益率,称作风险报酬,是由于投资组合的风险与市场的差异决定的。
后来,学者在CAPM理论框架下,为CAPM模型引入了α参数(alpha),用以表示组合业绩中超过市场基准组合所获得的超额收益。进一步将CAPM模型写成如下形式(詹森指数公式):
之后,随着APT(套利定价)、Fama-French等多因子模型的推出,使β系数从表达资产对市场因子的敏感度,扩展为对多个因素(如风格、行业等)的敏感性。
本文探讨的是个股内生性与行业之间的耦合,因此我们重点关注股票对行业因素的敏感性。假设 则可将表达式写成
其中,Rstock代表股票的预期收益率;R ind为所属行业指数的预期收益率,记作行业beta; 为个股相对行业的β系数,代表股票相对于其基准行业的弹性;α为个股超过行业所获得的超额收益,记作个股alpha。
由此可见,个股的收益同时取决于个股相对行业的超额α、行业收益Rind;
个股相对行业的弹性 \n 或许可以作为个股和行业的衔接桥梁。
耦合模型构造:左手个股alpha,右手行业beta
股票收益表达式 基于多因子模型的逻辑,我们可将股票的收益率用个股剥离行业后的因子(个股alpha)和行业因子(行业beta)进行预测,然后通过一个与相关的权重相结合。
整个过程可转换为 权重 Wind 和 Wstock 平衡行业情况和公司内生特性。行业得分取决于行业因素,可以用行业因子进行预测,从行业部分取得的收益记作“行业beta”;个股自身得分取决于公司的内生特性,我们可以通过剔除行业因素后的个股因子进行预测,将这部分收益记作“个股alpha”。 系数刚好可用来衔接左右两部分,即衔接权重可用个股对行业的弹性来刻画。
在这个过程中,个股评价和行业评价是“并联”进行,某种程度可以规避由“串联”模式带来的行业与个股的高联动效应问题。
当然,我们并不能直接假定 个股综合情况需要在行业评分和个股自身评分进行动态平衡,权重应该是此消彼长,权重之和为1。若某只股票相对行业的β系数高,受行业影响的权重高,则个股自身特性影响的占比就会减少;若受行业影响小,则自身内生因素影响就会更大。于是,我们进一步将权重进行归一化调整,得到最终的模型如下:
βstock,ind的合理性论证
βstock,ind为个股相对行业的弹性,记作β。在模型中,β用来权衡行业与个股的影响权重,是模型的重要参数,有必要进一步验证其合理性。在本文,采用的计算方式为,用个股和标的行业指数(中信一级)最近120日涨跌幅进行OLS回归,斜率即为。我们以今年8月31日为例,沪深交易所个股,剔除上市不满3个月的个股,结果见图表12,结果表明:
- 个股走势与行业走势呈现较强的同向性,行业对个股的影响不容忽视:近120日内,OLS回归结果表明个股相对行业出现负β的概率极低,也就是说个股与行业走势相反的概率很低,同时行业内个股的β中位数接近1,这与我们的认知一致,行业对个股的影响不容忽视。
- 行业内个股分化,需重视个股内生性因素:多数行业的个股β系数类对称分布,离散在0.5-1.5之间。银行、家电、电新、食品饮料、消费者服务的个股β系数分布左偏,中位数在0.8附近,说明这些行业内部存在明显分化,少数权重股对行业走势的牵引力大。个股β系数的分化验证了,行业周期和企业周期并非完全同步,行业好坏不能完全代表公司好坏,上行行业中有普通股,普通甚至下行行业中也有优质股,研究中不能忽视个股内生性因素。
- 个股β系数在时间序列较稳定,均值具有代表性:由于个股β系数的频率可高至日频,而我们的选股策略一般为月频,如果β系数的波动过大,则会降低策略的稳定性。在图表13和图表14,我们滚动计算了2013.1.1~2022.08.31 全市场个股的β系数近30日标准差的中位数std_mid(i)和离散系数的中位数V_mid(i) 。标准差用于衡量个股β系数在近30日的波动性,离散系数则用于衡量区间内个股β系数均值或中位数的代表性。
结果表明,对于大部分股票,近30日β的标准差的中位数和离散系数中位数分布在3%~5%,说明β在时间序列上的稳定性较好,均值具有代表性。在应用中,我们还可通过平滑处理降低β系数对调仓时点选择的敏感性,如对于月频调仓的策略,可滚动取5日、10日均值。
个股与行业之间如何进行动态平衡?
根据模型 个股内生评价权重 和行业评价权重 两者在“行业”和“公司”之间进行动态平衡,实际操作中,平衡的力度如何,平衡机制是否合理?我们通过3个不同的场景,用控制变量法进行逐一论证。
- 个股评价的权重略高于行业评价的权重。图表15,由于大部分个股β系数的取值范围为0.5~1.5,则行业评价权重在0.33~0.60,对应的个股内生因素的评价权重区间为0.40~0.667,权重略向个股评价倾斜。我们认为这符合投资逻辑,公司发展立足于行业,但更决定于自身的基本面、资金面、技术面等情况。
- 当行业评价权重高于公司评价权重时,行业赋予高弹性个股更高的额外价值;当行业评价权重低于公司评价权重时,行业对高弹性个股形成拖累。图表16中,股票1和股票2处于同一行业,公司评分相同且低于行业评分,股票1相对行业的β系数高,从行业获取的额外价值为12分;股票2的β系数低,从行业获取的额外价值只有6.7分。相反,股票3和股票4处于同一行业,个股自身评分相同,但均高于行业评分,β系数较高的股票3的综合评分则被行业拉低了11.7分,而β系数低的股票4只被拉低了7.5分。结果表明,当行业上行时,高弹性的股票能更好的享受行业赋予的beta,从中获取更高的额外价值;而当行业下行时,则容易被行业拖累。
- “好行业+普通公司”与“好公司+普通行业”的综合评价取决于公司股票对行业的弹性。“好行业、普通公司”和“普通行业、好公司”组合时我们投资中经常遇到的难题,两者到底怎么选?我们通过量化的方法提供一种选择思路。图表17 中的股票1和股票2分别属于“好行业、普通公司”和“普通行业、好公司”组合,假设两者相对各自行业的β系数都较低,则说明其行业对股票1和股票2的影响小,公司自身的权重更大,结果偏向认为“普通行业、好公司”为更优组合。相反,如果两者的β都较高,则受行业影响大,“好行业、普通公司”更优。
综上,理论上,通过耦合模型
\n 动态平衡“行业”和“公司”具有可行性,为个股优选提供了一种新思路。
基于耦合模型的双驱选股策略
本章将从实践出发,论证将个股与行业通过前文构造的耦合模型相结合的有效性。首先通过行业中性的多因子策略构建个股评价模型,然后构建行业评价模型,最后通过耦合模型将两个并行策略结合形成对个股的综合评价。
基于盈利、估值、技术面的三维个股评价模型(alpha)
我们主要从盈利、估值、技术指标三个维度综合评价个股,期望入选公司的基本面向好、估值合理、兼顾交易逻辑,即“好公司”、“好价格”、“好股票”。
因子处理方式包含:中位数去极值、行业中位数填充(不适用于分析师预测类因子)、行业市值中性化、z标准化。单因子检测参数为:
- 样本池:全A,剔除ST、*ST、上市3个月内、北交所个股
- 区间:2013.1.1-2019.12.31
- 分层回溯:10组,分组1为多头,分组1-分组10为多空组合,组内等权
- 换仓频率:月频,第一个交易日
- 基准:中证800
自定义单因子评价指标的说明:
- 作用方向:衡量因子对收益率的预测方向。1代表测试结果为正向;-1代表测试结果为负向;0代表在历史样本中的作用方向不稳定。若作用方向为负向,则根据具体情况将因子值取相反数或取倒数使得分组1为多头组合。
- 单调性:衡量因子的区分能力和选股能力,指标值越高说明单调性越明显。评价子指标包含分组收益率、夏普比率、调仓胜率、超额最大回撤,分别测试各个指标与分组序号的秩相关系数,然后取均值得到最终的单调性值。
基本面:盈利趋势向好
盈利能力和盈利周期是股价上涨的基石,我们分别从公告的历史盈利和分析师预测未来盈利两个维度测试了盈利增速因子的表现,测试指标类型包括盈利同比因子原值、所处分位、纵向z标准化值、季度环比改善。
- 盈利同比的分位(_pct):衡量的是公司在自身的盈利周期所处的位置
- 盈利同比的纵向z标准化(_zs):衡量盈利水平和盈利波动
- 同比的环比(QoQ):指公司盈利增速的环比改善程度,多被用于衡量景气度
在训练集(2013.1.1-2019.12.31)的单因子检测结果见图表21:
- 分位形式的盈利增速因子代表其在自身盈利周期所处的位置,表现较突出。不同指标类型的因子表现排序为:盈利增速分位形式的因子 > 同比的环比 > 因子原值 > z标准化形式因子。分位形式的因子表现较突出,尤其是多头较其他形式的因子有更高的多头收益、更低的回撤、更显著的单调性。
- 披露盈利因子的稳定性整体好于分析师预测盈利因子(RankIC_IR),究其原因,主要是分析师预测因子在全A的覆盖度仅约50%,在我们的测试区间的覆盖度更低。
- 考虑预报、快报数据的盈利因子(_NT)表现好于只考虑正式报告的因子,究其原因,我们认为是业绩预告和快报的发布时间较正式报告提前,股价已经在业绩预告和业绩快报中得到一定反应和释放,到正式报告发布的时候,市场的敏感度降低。
我们分别从披露盈利和预测盈利两个类别中各选择一个表现最好的因子等权构建“盈利因子”,净利润同比增速的分位因子(NP_YoY_NT_pct)和预测ROE同比增速的分位因子(EST_ROE_YoY_pct),代表公司的盈利水平处于上升周期且盈利能力持续向好。“盈利因子”的RankIC为3.4%,多头年化超额18.3%,夏普0.82,合成因子的表现较两个子因子均有所提升。
估值:守住安全边际
前边我们从基本面维度定义了“好公司”,盈利趋势向好(盈利增速分位)且盈利能力(ROE)强,但“好公司”也必须具有一定的安全边际。
由于不同行业的属性不同,适用的估值方法不一,如强周期或重资产行业和弱周期或轻资产或稳定盈利的行业适用的估值方法显然不一致。因此,我们分别采用全局估值法和分域估值法测试了估值因子的表现,选用的估值因子为广泛使用的PE、PB,因子形式为因子原值和近3年的分位值。其中,PB因子包含PB原值和调整商誉后的PB (PB_adj_GW)。
- 全局估值法
全局估值法指所有个股使用同样的估值因子,分别测试PE、PB因子及其分位数形式因子的表现。
- 分域估值法
分域估值法指考虑不同行业的特性,对不同行业属性的成分股赋予不同的估值方法,为了避免模型过度复杂和分域后子样本太少影响模型的实用性,我们简单分为了两类:强周期或重资产行业采用PB估值法,弱周期或轻资产或稳定盈利的行业采用PE估值法。
分域估值因子的整合逻辑为:
- 估值因子原值形式,记作“分域估值”:由于不同类型的估值因子不可直接进行比较,因为我们先对采用同种估值方法的个股进行聚类,先后进行去极值、行业市值中性化、z标准化后,形成最终的分域估值因子。
- 分位形式的估值因子,记作“分域估值_pct”:该方法逻辑易懂,都是分位形式,量纲相同,具有直接可比性,因此不进行聚类,直接对截面期的所有个股进行去极值、行业市值中性化、z标准化。
估值因子的单因子检测结果见图表24,PE因子的表现较PB因子更稳定,分位形式的分域估值因子的表现明显好于其他估值因子,分域估值RankIC为5.0%,多头年化超额19.2%,夏普0.83。我们选用“分域估值_pct”作为最终的估值因子。
技术面:兼顾交易逻辑
盈利是基石,估值是安全边际,两者组合可兼顾投资逻辑,但无法兼顾交易逻辑。也就是说,兼顾盈利与估值的公司并非好的交易标的,技术面因子跟市场的价量关系捆绑的更紧密,是交易的结果,数据频率更高,反应最直观,能较好的兼顾交易逻辑。我们整理了常见的四类技术面基础因子,成交额分位、换手率变化、价格动量、价格形态。成交分位代表了交易的热度,价格斜率可用来形容股价走势的缓急,换手率变化可看出多空双方的分歧程度,价格动量则是趋势的延续性。
技术面因子的单因子检测结果见图表26,换手率因子的表现最稳定,多头超额、单调性均较好;动量类因子的表现不稳定,风险收益比低;价格形态类和成交量因子的作用方向不明确,不具备选股能力。因此,我们选择换手率变化因子TECH_TURN5M60,5日换手与60日换手的差值作为最终的技术面因子,其RankIC为9.0%,多头年化超额23.2%,夏普0.97。
风险管理:规避崩塌风险
长期看,兼顾盈利与估值的公司有较大的上涨潜力,但股价的短期波动受多方面因素影响,其中最主要的风险是股价持续下探的风险和高位崩塌的风险,两种场景往往都伴随着成交量和换手率的放大。
回顾上一小节,我们测试了包含换手率变化、价格斜率和成交额分位等技术指标,单因子测试表明短期换手率变化因子、价格斜率、成交额分位因子具有负向剔除作用,因子值最高的10%构成的组合的收益明显低于其他组合,回撤明显高于其他组合。我们用价格斜率可用来形容股价位置,成交额判断热度,换手率变化判断多空双方的分歧程度,将三个指标联合起来则可用来形容一种常见的场景:“热度高的个股在高位出现分歧后易崩塌”,于是我们将这三个因子等权合成“风险因子_高位崩塌”,测试其表现。图表27~图表29原因子和合成因子的分组表现,合成因子有明显的负向剔除能力。统计结论与我们的经验一致,如果某只股票在连续快速拉升后,成交额出现放量且换手率显著增大,表明多空双方的分歧较大,股价短期难以维持上升态势,也符合A股的短期反转逻辑。
以航天信息为例,图表31,2018.04.02,其上涨斜率位于全市场前10%、换手率增加值位于前10%、当日成交额与成交额占比位于近3个月中的90%分位之上,预示后续有崩塌风险,结果表明,其在当月下跌13.8%,相对上证指数的超额为-5.7%。同理,图表32,广和通在2017年10月9日触发了上述警示阈值,其当月下跌幅度达26.6%,相对超额-18.1%。
图表33和图表34统计了2018-2022.08.31、上市超过3个月、沪深交易所个股,上涨斜率、换手变化和成交额分位值位于前10%的个股当月(20日)的涨跌情况,统计时间为每月第一个交易日。统计结果表明,触发阈值股票的超额收益(基准为上证指数)分布图为右偏,大部分超额靠左而少数极大值远离数据群孤立于右。整体看,当月跑输基准的比例为65%,跑输中位数为2.7%,有35%的个股月度跑输超10%;分年度看,除了2013年的月度超额均值为正,其余年度的超额均值均为负。
我们尝试用同样的方法判断“持续下探风险”,根据价格斜率因子的分组表现可见斜率最低的组(分组10)的收益也处于靠后位置,将三个指标结合可用来形容股价持续下探的场景:如果某只股票在连续下跌后,成交额出现放量且换手率显著增大,表明多空双方的分歧加大,股价可能出现加速下探的风险。我们假设下跌斜率位于前10%、换手率增加位于前10%、当日成交额与成交额占比位于近3个月中的90%分位之上,后续可能会出现持续下探的风险,并检验该假设的有效性。
图表35为康弘药业的走势图,检测到其在2021.4.1的下行斜率、换手率和成交额指标均为前10%,当月股价持续下探,跌幅达26.1%。但我们发现,利用上述规则统计的效果不尽人意,这与A股存在明显的短期反转效应有关,1个月和3个月动量因子的表现也验证了这一现象,也就是说,如果股价快速下行一段时间后,成交额出现放量且换手率显著增大,也可能是底部反弹的信号。图表36的融捷股份就是这种情况,在下跌一段时间后,换手和成交额变化排名均靠前,后续股价强势反弹,反弹幅度远大于同期大盘和行业指数。
基于以上结论,我们引入预防“高位崩塌风险”的负向剔除机制,剔除价格斜率高、换手率增加居前、成交额分位三个指标在横截面同时居前的个股。
基于盈利、估值与技术指标的个股优选策略
综合上述的“盈利因子”、“估值因子”和“技术因子”因子构造rank-based个股优选模型,将每个维度的因子在横截面排名得分后等权加权得到最终的个股评分。
每月初调仓,选择得分靠前的50只个股构成股票组合,并持有至下一次调仓。调仓时,考虑涨跌停、停牌等无法交易的情形,若持仓股出现跌停或停牌,则持有至下一调仓期,同时,组合可买数量调整为50-无法卖出的个股数量。策略回测参数为:
- 样本池:全A,剔除ST、*ST、上市3个月内、市值靠后的20%,以及北交所上市的个股
- 回测时间:2013.1.1-2022.11.11
- 调仓频率:月频,第一个交易日
- 手续费:单边千3
- 基准:中证800
- 组合数量:50只
- 组合内个股权重:等权
策略在2013.1.1-2022.11.11的表现见图表38-图表39,优选50等权组合的年化收益率为28.3%,相对中证800的年化超额22.3%,月度调仓胜率65%,年度胜率为90%,月度股票数量换手率为57%。
图表41为组合业绩的Brinson归因结果,超额收益多源于互动效应,主动行业配置和标的选择的收益不相上下,但都不高。
基于资金面和分析师预期的行业评价模型(beta)
个股评价层面,我们主要从盈利、估值、技术指标三个维度,行业评价层面,我们则从情绪面和资金面对行业进行评价,其中,情绪面的观察指标为分析师维度的盈利调整,资金面则选用被称为“聪明钱”的北上资金的边际变化情况。
情绪面:分析师维度的盈利上修
分析师预测包含3种类型,价格范围预测、投资评级和盈利预测。价格预测给定的是范围,较难跟踪;投资评级一般只有买入和增持,评级的区分度较小且较粗糙;盈利预测,如营收、净利润、每股收益EPS、资产收益率ROE等,分析师根据掌握的信息对盈利进行预测或预测修正,相较价格预测和投资评级而言,更具有市场效应和实用价值,而分析师盈利预测调整是对公司有效信息及时跟踪的结果,相较于盈利预测本身更具有信息价值。因此,本文选择了分析师维度的盈利预测累计调升占比和盈利预测平均调升幅度作为行业优选指标,盈利指标为净利润,预测年度为最近年度 FY1(以观察日为基准),时间区间为近3个月的分析师盈利调整记录。指标的具体计算步骤如下:
分析师维度的情绪因子测试结果见图表43,合成的“情绪因子”对两个子因子盈利预测累计调升占比和盈利预测平均调升幅度进行了较好的综合, RankIC均值为6.1%,多头年化超额5.4%。
资金面:锚定”聪明钱“
北上资金是近年来A股最大、最稳定的增量资金之一,目前的成交额占比达到了10%,与A股走势的联动性较高,被很多投资者称之为“资金锚”,其边际变化十分具有参考意义。由于我们的策略为月频调仓策略,因此我们选用的因子为“陆股通月度持股市值占比变化”,记作 因子测试时间为:2017.1.1 – 2020.12.31。
其中 为t日北上资金持股占行业流通市值的比例。北上资金因子的测试结果见图表44,RankIC均值为5.6%,多头年化超额11.2%。
构建基于资金面和情绪面的行业轮动策略
将上述获得的资金因子和分析师情绪因子等权合成最终的行业优选因子,每月初选择得分靠前的3个行业等权构成行业组合,并持有至下一调仓期。
行业组合在2013.1.1 - 2022.11.11,年化收益率为21.9%,相对中证800的年化超额为16.2%,调仓胜率69%,年度胜率100%。
构建alpha和beta双驱的个股优选策略
有了个股评价模型和行业评价模型,现我们利用前边构造的耦合模型将两者结合起来,验证耦合后策略的有效性。
其中,
为个股相对行业的弹性,计算方式为:用个股和标的行业指数(中信一级)最近120日涨跌幅进行OLS回归,斜率即为 避免异常值影响,横截面缩放至[0.5,1.5]。
个股alpha和行业beta双驱策略的构建步骤如下:
- 个股评价模型(alpha):基于上述获取的“盈利因子”、“估值因子”和“技术因子”因子构造的rank-based模型,将每个维度的因子在横截面排名得分后等权加权得到最终的个股评分。
- 行业评价模型(beta):基于资金面和分析师预期调整构建行业评分模型。
- 个股缩样,剔除低alpha个股:在每个截面,有效的个股数量(2000-4000)和行业数量(30)存在明显的差异,若直接将个股和行业评分标准化之后的结果带入模型,则个股综合评分易受极端alpha和极端beta的影响,因此我们需要将个股池缩小。回顾我们构造耦合模型的初衷是,希望选出能兼顾alpha和beta的个股,alpha理应属于中上水平,因此我们可以剔除低alpha部分,本文的目标组合包含50只个股,我们选择保留alpha得分靠前的600只个股,平均每个行业20只个股。然后,将600只个股的评分缩放至行业评分的上下限,以保证个股和行业评分的平衡和直接相加的合理性。
- 计算个股综合评分:
- 加入预防“高位崩塌风险”的负向剔除机制,剔除价格斜率、换手率增加值、成交额分位在横截面都居前的个股。
每月初调仓,选择得分靠前的50只个股等权构成股票组合,并持有至下一次调仓。调仓时,考虑涨跌停、停牌等无法交易的情形,若持仓股出现跌停或停牌,则持有至下一调仓期,同时,组合可买数量调整为(50-无法卖出的个股数量)。策略的回测参数为:
- 样本池:全A,剔除ST、*ST、上市3个月内、市值靠后的20%,以及北交所上市的个股
- 回测时间:2013.1.1-2022.11.11
- 调仓频率:月频,第一个交易日
- 手续费:单边千3
- 基准:中证800
- 组合数量:50只
- 组合内个股权重:等权
alpha与beta双驱策略的回测结果
将个股评价和行业评价耦合后的alpha与beta双驱策略在2013-2022.11.11的表现见图表49和图表50,优选50等权组合的年化收益率为31.0%,相对中证800的年化超额24.9%,夏普比率1.06,月度调仓胜率66%,年度胜率为90%,月度股票数量换手率为63%。图表51为组合业绩的Brinson归因结果,超额收益主要源于互动效应和主动行业配置,相较于引入行业beta之前的alpha策略,双驱策略组合的行业配置收益有了明显提高。
个股alpha和行业beta的耦合具有协同效应
记“个股alpha”为只考虑alpha的个股优选策略,“行业beta”只考虑行业beta的行业轮动策略,“alpha+beta”为兼顾个股alpha与行业beta的耦合双驱策略。
图表52为兼顾行业beta后双驱选股策略的整体表现,所有的收益指标均有所提升、风险指标均有所降低,风险收益比得到了提升。双驱选股策略的年化收益率提升了2.7%,夏普比率提高了0.11,调仓胜率提高了3%,盈亏比提升了0.2;最大回撤降低了4.5%,超额回撤降低了1.7%。
图表54为三个策略的分年度表现,7/10年的收益和夏普为正贡献,且负贡献年份拉低数值均较小,8/10年降低了超额回撤。在个股alpha策略或基准表现欠佳的年份,结合行业beta后的策略表现有所提高,如在基准表现较差的2016、2018、2021年,alpha+beta策略较个股alpha策略的年度收益分别提升了6.7%、0.3%和1.7%;在2017、2019、2020年,个股alpha策略相对基准的表现欠佳或优势不明显,叠加行业beta后的双驱策略的年度收益分别提升了6.2%、1.3%和7.6%。
图表55分别统计了alpha策略和基准表现最差的20%月份中,双驱策略与alpha策略的调仓收益情况:在alpha表现最差的20%月份中,65%的概率叠加beta对策略收益有所提升,且相对alpha策略的盈亏比为1.59;在基准中证800表现最差的20%月份中,61%的概率叠加beta有助于提升alpha策略的表现,双驱策略相对alpha策略的盈亏比为1.36。
引入主动管理beta机制后,组合的行业分布有变化,增加了对高评分行业的暴露,行业配置也有所提高。以最新一期为例,见图表56,行业轮动组合最新一期排名前3的行业分别为煤炭、电力设备及新能源和有色金属,双驱组合在这三个行业的股票数量分别增加了2、4、5只。从组合收益的Brinson业绩归因来看,图表58,兼顾行业beta后主动增加了对高评分行业的暴露,行业配置的收益也确实得到了提升,所有期行业配置的收益均值从0.34提升至了0.56。
一个疑问,如果我们直接使用个股因子+行业因子进行选股,不做行业中性化,是不是也可以增加行业暴露?我们也测试了这种方法,但效果并不理想。最直接的原因是,这是一种被动暴露行业beta的方法,暴露的beta可能并非“好beta”,而我们通过动态耦合模型构造的alpha与beta双驱策略是主动管理的行业beta。
分析纯个股alpha策略和alpha+beta双驱策略的持仓,两者交叉持仓的比例约55%,即有约45%的个股在alpha+beta双驱策略构建的组合中,但不在个股alpha策略构建的组合中,也就是说,有45%的个股是由于行业的作用被选入到最终组合中的。然而,从换手看,兼顾行业beta后的换手率与之前并无明显增加,从57%提至了63%,换手适中。
组合权重优化提升策略稳定性
在前文中,我们构造的是等权组合,即优选的50只个股的权重相同,并未考虑各个标的风险和标的之间的相关性,但从量化策略追求收益稳定性的角度而言,关注各标的本身的特异性和标的之间的相关性是至关重要的。因此,我们通过研究各标的历史价格的协方差、波动率等情况,对股票组合内部的权重进行再配置,探讨引入组合权重优化方法来优化前述的等权投资组合的有效性。经典的优化目标包含最大化收益率、全局最小方差、最大化夏普率、最大化效用函数和风险平价等,我们以最常见的评估指标,“夏普比率”为例,探讨“最大化夏普比率”的有效性。
夏普比率是投资收益和投资风险的比值,表示每承担一个风险可以拿到的超额收益,夏普比率越高则表明性价比越高。我们以“最大化夏普比率”为优化目标,求解投资组合在满足约束条件下达到优化目标的最优权重。优化模型的目标函数见图表62,约束为:
设置为等权权重上移200%,即权重上限为等权*3;为等权权重下移80%,初始权重为等权。在我们的50等权组合中,个股权重的上限,下限。
由于个股日频收益率的协方差噪声很大,且考虑到策略的调仓周期为月频,因此我们选取的收益率向量为过去6个月的周频收益率。
“最大化夏普比率”有一定的优化效果,且优化目标下的再平衡权重发生调整的占比适中。优化结果见 图表63 和图表64,优化后组合的年化收益由31.0%提升了1.4%至32.5%,相对中证800的年化超额由24.9%提升至了26.3%,夏普比率由1.06提升至了1.11。图表65和图表66为优化后组合内个股的权重情况,优化后组合内95%的个股的权重下移,由初始的2%下移至1.84%,约3%的个股权重出现了上调,权重调整的幅度和权重出现变化的占比处于合理水平。
综上所述,从实际的回测结果来看,在个股alpha策略上叠加追求高beta的行业轮动策略具有协同效应,叠加后的alpha+beta策略提高了风险收益,换手也并未明显增加,做到了兼顾了挖alpha和追beta,适中的换手率也在策略的为操作的可行性保驾护航。引入“最大化夏普比率”后对等权组合有一定的优化效果,优化目标下的再平衡权重发生调整的占比和变化幅度可控,且策略的稳定性得以提升。
总结
投资收益的来源包含alpha和beta,理论上,我们希望在风险可控的前提下,alpha和beta收益都高,但在实践中,尤其是量化研究领域,我们一般解决的问题是“挖alpha”或“追beta”,“选个股”或“选行业”的问题,并不能将两者进行有效兼顾。我们认为,一方面,A股的行业效应不可忽视,pure alpha日渐稀缺;另一方面,公司周期与行业周期并非完全同步,个股的内生特性也值得深挖。基于此,本文尝试构建了连接个股与行业的耦合模型,有效的将行业评价和个股评价相结合,取长补短,即能保护个股的内生性又能享受行业赋予的beta,共同驱动投资效益。
在第二章中,我们借鉴经典的资产定价模型,通过个股相对行业的弹性β构建了权衡个股和行业评价的耦合模型, 模型通过个股相对行业的弹性来平衡个股自身特性和行业的作用力度。
在第三章中,我们实例论证了将个股与行业通过耦合模型相结合的有效性,先后构建了基于盈利、估值、技术面的三维个股评价模型(alpha),基于资金面和分析师预期的行业评价模型(beta),最后通过耦合模型将两个并行策略结合构造alpha与beta双驱选股策略。
从实际的回测结果来看,在个股alpha策略上耦合主动管理beta的行业轮动策略具有良好的协同效应,叠加后的双驱策略相较于原始的个股alpha策略,所有的收益指标均有所提升、风险指标均有所降低,风险收益比得到了有效提升。2013.1.1-2022.11.11,alpha与beta双驱策略,优选50等权组合的年化收益率为31.0%,相对中证800的年化超额24.9%,相较于原始的alpha策略,双驱策略的年化收益率提升了2.7%,夏普比率提高了0.11,调仓胜率提高了3%,盈亏比提升了0.2;最大回撤降低了4.5%,所有期行业配置的收益均值从0.34提升至了0.56。在双驱策略构建的组合中,引入“最大化夏普”对组合个股权重优化后的表现得到了进一步提升,优化后50等权组合的年化收益提升至了32.5%,年化超额为26.3%,夏普比率提升至了1.11。
风险提示
量化模型基于历史数据,过去的回测业绩不代表未来;量化模型本身存在失效的风险。