因子投资时应该进行行业中性处理吗
由crisvalentine创建,最终由crisvalentine 被浏览 99 用户
导读
- 作为西学东渐--海外文献推荐系列报告第一百三十七篇,本文推荐了Ehsani, S., Harvey,C. R., 和 Li, F.于2021年发表的论文《Is sector-neutrality in factor investing amistake?》
- 股票特征有两方面的预测能力。一方面能够预测行业之间的预期收益高低,另一方面能够预测行业内个股预期收益的高低。过去的研究普遍发现,公司特征对于预测股票收益能力最强,这导致许多投资者对冲掉了行业敞口。我们将在文中证明这个问题等同于经典的两风险资产问题,并推导出何时应该进行行业中性。本文从分析和实证两个角度说明,多空投资者应该进行行业中性处理,而纯多头投资者则不应进行行业中性处理。
- 对于每一个因子投资者而言,是否行业中性都是必须要面对的问题。比如在构建指数增强组合时,投资者往往倾向于行业中性,希望获取因子在行业内的选股收益。但本文的作者通过均值方差理论和实证数据表明,纯多头投资者不应进行行业中性化处理,因为因子在行业层面的收益贡献显著,但多空投资者应该进行行业中性化处理。本文所利用的理论简洁,结论明确,适合A股因子投资者参考。
风险提示:文献中的结果均由相应作者通过历史数据统计、建模和测算完成,在政策、市场环境发生变化时模型存在失效的风险。
引言
公司的特征,如规模、账面市值比(Book-to-market ratio)和动量通常与预期收益相关 (Banz (1981); Rosenberg, Reid, and Lanstein (1985); Fama and French (1993); Jegadeesh and Titman (1993))。学界对于公司回报的预测能力来源看法不一。Moskowitz and Grinblatt (1999)认为股票的动量来源于行业特征。而其他的学派,如Asness, Porter和Stevens (2000) and Novy-Marx (2013)认为公司特征则包含了大部分的信息,所以投资者可以构建行业中性的投资组合来获取收益。
在本文中,我们首先证明了公司特征比行业特征在预测股票预期回报时包含更多的信息。然后,我们判断了效果较弱的预测指标何时应该被忽略。通过同时计算夏普比率和相关系数,得出结论:在多空组合中行业特征往往是多余的;因此,多空投资者可以构建行业中性组合获取收益。相比之下,纯多头组合的表现可能因行业中性而变差。我们使用多种组合构建方法,基于历史数据进行模拟测试,最终证明了以上结论在实际数据中是有效的。
为了证明上述结论,我们假设Z由两部分构成:Z=X+Y。如果把Z视作是账面市值比,X和Y分别代表账面市值比中公司特征及行业特征。投资者可以兼顾两个特征并赚取Z×r = (X + Y)×r的收益,或者可以仅采用X或Y来赚取X×r或Y×r的收益。如果X比Y在预测股票回报时更准确,则风险收益回报X×r优于Y×r。那么,均值方差投资者应该基于公司特征(X)还是同时基于公司特征和行业特征(X + Y)来构建投资组合呢?在X存在时预测变量Y是否多余?这个问题等同于一个静态两风险资产问题,
我们的实证工作表明,夏普比率是决定不等式(1)中预测指标是否有价值的主要因素。在多空组合中,公司特征和行业特征的夏普比率差别较大,并且公式(1)中相对夏普比率很小。因此,投资者可以在多空组合中仅使用更强的预测指标(即行业内选股指标)就可以改善多空组合的风险收益。相比之下,纯多头因子下行业特征和公司特征的夏普比率差异较小。在这种情况下,因为不等式左侧通常接近于1,所以不等式不成立。因此,多头投资者最好同时将行业及公司特征考虑在内。
根据夏普比率和相关系数的比值计算,在采用公司特征同时采用行业特征使多空组合和纯多头组合夏普比率上升的概率分别为29%和78%。因子数据的模拟测试证明了我们的分析是合理且准确的:在多空组合中,保留行业特征仅在20%的试验中收益更优,而在纯多头组合中,78%的试验更优
图1展现了我们的实证结果:两个因子夏普比率之间的差异:**SR*指仅采用行业中公司特征(即行业中性)构建组合的夏普比率,而SR则是同时采用行业及公司特征(即原始因子)构建组合的夏普比率。**我们用不同的组合构造方法所产生的平均因子进行了1000次模拟测试并计算了他们的夏普比率之差,差为正数说明行业中性因子优于原始因子。该图显示:无论基于哪种组合构建方法,多空组合均呈现正向变化。因此,多空投资者应当进行行业中性处理。相反,对于纯多头组合而言,平均变化呈现反向。行业中性在大市值股票中的因子值加权纯多头组合中表现最差,但这个组合在图1中收益最高。
下文将按以下结构推进:文章第二部分将是否需要预测变量的问题与Markowitz (1952)的均值方差理论联系起来。第三部分展现了实证结果。最后一部分进行总结。
是否需要行业中性的理论分析
基于均值方差模型的分析
一个科技公司的账面市值比(Book to Market Ratio)可能高于其他科技公司,但对比非科技公司,其账面市值比较低。尽管此公司的投资价值相较于其他科技公司更高,但多空组合使用账面市值比筛选股票时会做空这家公司,因为该公司所在的科技行业往往具有较低的账面市值比。在这种情况下,基于账面市值比对公司回报的预测包括三部分:账面市值比的行业特征预测了行业层面的回报,账面市值比的公司特征预测了公司层面的回报,或是两者兼有。也就是说,基于账面市值比来筛选的组合,其回报来源于行业和公司两个层面。我们用Across和Within分别指代行业特征和公司特征。不同特征所产生的回报可以分解为:
其中ρ是两个特征回报之间的相关系数。图2绘制了相关系数在0和1之间、相对夏普比率在0和2之间的配置数据。从图中可以看出,对于行业偏离,最优配置比可能为正或负。
公式3中的最优配置假设公司特征与行业特征具有相似的波动率。当满足以下条件时,公式2中的最优权重为负:
不等式4权衡了行业特征的相对回报与分散化收益。若行业特征与公司特征不存在相关性时(ρ=0),将行业特征纳入投资组合会给组合带来巨大的分散化收益(即使行业成分指标的夏普比率较小)。若两个特征存在高相关性(ρ ≈ 1),只有当行业特征与公司特征的夏普比率相近时,才可将行业特征纳入投资组合。总的来说,当行业特征的夏普比率较低,或其与公司特征存在高相关性,或二者都存在时,投资者不应该使用行业特征(即进行行业中性处理)。
上述不等式能够解决行业特征VS公司特征的问题。若两组特征的相对夏普比率比两者的相关系数小,投资者仅采用公司特征会获得更高收益。否者,使用原始原始因子(不进行行业中性化处理)会获得更高收益。
分解各指标及其收益
实证结果
行业偏离的说明
收益分解的实证结果
我们用公式(10)和下列因子构建方法对股票的收益进行分解:针对多空组合和纯多头组合分别采用等权、因子排名加权及因子值加权三种构建方法,计算了公式(4)中的各变量结果。组A展现了行业特征及公司特征的夏普比率、两个夏普比率的比值以及行业特征、公司特征的平均相关系数。根据公式(4),若行业特征和公司特征的相对夏普比率低于两个特征的相关系数,则不应使用行业特征。组A显示,多空因子行业特征的夏普比率与公司特征的夏普比率之比是0.18,它们的相关系数是0.46,0.18<0.46,采用公司特征更有利于多空组合投资者。
纯多头因子的组合则有所不同:公司特征及行业特征的夏普比率相似,而两者的相对夏普比率为0.93,这说明从均值方差的有效性来看,多头因子中行业特征比公司特征略低。行业特征和公司特征收益之间的平均相关系数为0.75,0.94大于0.75,所以不等式无法成立,因此纯多头组合的投资者在构建组合时应该同时使用行业和公司特征。。总的来说,多空组合应该做行业中性化处理,但纯多头组合则不应该。
我们接下来展示12个行业分类中不同因子的结果。表2展示了每个因子的收益分解情况。表2左侧数据展现了每个多空因子行业及公司特征的收益。我们需关注收益分解及各特征的夏普比率(T值)。如果公司特征的T值大于整体因子的T值时,仅基于公司特征交易的投资者风险收益最高。我们发现,在多空因子中,公司特征的T值更高这点与Asness, Porter, and Stevens (2000)和 Ehsani, Hunstad, and Mehta (2020)的研究一致。规模因子、价值因子和投资因子收益最高。
表2右侧数据展现了纯多头因子的收益情况。纯多头因子T值的趋势与多空因子相反,整体因子的T值最高。但纯多头因子的公司特征的均值方差表现比行业特征的更好。对于动量因子来说,不管采用哪种加权方式,公司特征的表现总是高于行业特征的表现。举个例子,等权方法构建的动量因子中,公司特征的T值为4.60,但行业特征的T值为3.95。然而,整体动量因子(行业特征的动量因子及公司特征的动量因子)的T值是最大的,这说明纯多头投资者不应该仅仅采用行业内的因子进行投资。该结果看似有些奇怪,但可以用公式(4)完全解释:只有当行业特征的夏普比率相对较低的情况下,才应该进行行业中性化处理。因此,纯多头投资者同时考虑行业及公司特征会获得更高收益。
行业层面的分解
表3详细列示了多空价值因子组合在行业层面的收益分解:其展示了各行业的平均风险敞口以及对投资组合的回报和方差贡献。我们在第一组中展示了原始因子(整体)的结果,并在下面的组中分别列示了两个特征分别的结果。通过结构调整,原始因子的敞口及回报分别等于行业特征及公司特征敞口及回报的加总。由于行业特征及公司特征间存在协方差,因此这两个特征的方差之和不等于原始因子的方差。
有趣的是,最下面一组数据里的每个行业中公司特征的收益均为正:公司特征对整体组合的贡献十分显著(平均收益为0.22%,T值为3.52)。第二组中,行业特征的净收益接近于0。针对横截面上账面市值比因子的行业特征进行交易有着较高的收益,而针对账面市值比因子的公司特征进行交易,其结果则截然不同。该结果表明,账面市值比因子的预测能力源于其公司特征。基于账面市值比因子筛选股票的多空投资者会因行业特征的干扰而忽略了有效的公司特征。回归开头的科技公司案例,基于账面市值比因子交易的组合会看空科技公司,因为与其他公司相比,大多数科技公司被认为是成长型公司。因此,原始价值因子没有利用科技行业内的账面市值比因子(组合做空了全部科技类股票)。表3显示,横截面上科技公司的账面市值比因子带来溢价显著,为0.04%(t值为2.07)。此结果验证了前文的推断:行业特征的扰动,导致了基于原始因子构造的多空因子比仅基于行业内公司特征构造的因子有效性低。
表4及表5展现了纯多头和纯空头价值因子的行业层面收益分解。表4显示,多头价值因子在每个行业上的敞口都为正,因此每个行业对组合的总收益0.82%(t值为4.22)都有正的贡献。表4中第二个组展现了每个行业对于多头因子收益的贡献:行业特征有着较大的T值4.33(比第三组展示的多头因子中公司特征T值3.90要大)。事实上,使夏普比率最大的最优配置是将86%比例配置于行业特征、14%比例配置于公司特征,这样的话纯多头因子的T值会达到4.50。表4中的主要结论是行业及公司特征对于纯多头因子的收益都有一定的贡献。
表5展示了各行业对于空头价值因子的敞口贡献及收益贡献。原始空头价值因子会做空账面市值比低于平均的股票。该投资组合平均每月损失0.59%,T值为-2.75。表5中后两组分解了负收益情况:行业特征产生了-0.20%的负收益(T值为-2.72),公司特征产生了-0.39%的负收益(T值为-2.57%)。值得注意的是,来自行业特征的收益贡献为-0.20%,数值正好与表4中行业成分特征贡献的0.20%一致。然而,公司特征的收益贡献为-0.39%,小于多头因子的公司特征收益(0.61%)。
表4和表5的比较结果表明:多头端账面市值比因子的预测能力不是只通过账面市值比因子的公司特征实现,投资者也可以基于账面价值比因子的行业特征获取收益;但空头端账面市值比因子的预测能力是通过公司特征实现的。总的来说,账面市值比因子的公司特征在识别行业内表现不及预期的股票(应该被做空)时比较有效,但预测不了表现出色的股票(应该做多)。多空价值因子的公司特征表现超过了整体多空价值因子的表现,仅仅是因为公司特征在构建组合空头端时更有效。
我们接下来研究各部分的方差:多头价值因子的行业特征方差为1.53(表4),空头价值因子的行业特征方差为3.59(表5)。因此,空头端行业偏离所产生的较大方差不能被多空组合中多头端的方差有效分散,方差不对称导致了多空价值因子的行业特征有着较大的方差3.20(表 3)。另外,公司特征中的方差不对称程度较小:多头价值因子的公司特征方差为17.74,而空头价值因子的公司特征与前者方差相近,为16.01。
总结来说,以上结果说明账面市值比因子的行业特征更适合预测表现优异的行业,而账面市值比因子的公司特征则更适合预测行业内表现不佳的股票。因此使用账面市值比因子的行业特征构建多头端,同时使用其公司特征构建空头端构建空头端,构建的多空组合夏普最高。
对于行业分类数量的敏感性
为了更简洁的展示结果,之前的测算仅基于12个行业分类。本章对选择不同行业分类数量的敏感性进行了测试,然后展现了行业中性影响最大的两种构建方法的结果。其中等权的多空组合收益最高,而因子值加权的纯多头组合表现最差。用其他方法所构建的投资组合,其夏普比率位于二者之间。
图4展现了等权的多空组合中行业中性因子与原始因子的夏普比率之差。图中结果表明大部分使用等权方法所构建的因子在行业中性下的表现都更好,与行业分类数量无关。
图5展现了因子值加权的纯多头组合在采取行业中性后的夏普比率变化。再次强调,我们发现选择不同的行业分类数量通常不影响结果。不管行业分类数量多少,当行业中性后,夏普比率都会下降。将图4和图5进行比较后,可以判断,是否进行行业中性化处理,主要是看多空组合还是纯多头组合。前者更有可能因行业中性而获得更多收益,而后者恰好相反。
结论
采用因子投资的投资者会面临众多选择——一旦确定了一组因子,后续的选择就会接踵而至。比如选取的因子是否应该进行行业中性处理?如果进行行业中性处理,应该如何选择行业数量?这些选择是否应该根据具体因子做调整?多空投资者与纯多头投资者相比,选择是否可能不同?文章针对这四个问题进行了研究。
学界有研究过使用特定的因子时是否应该进行行业中性处理,本文提出了一个简单的框架因子包含两种预测能力:对行业特征的预测能力、对公司特征的预测能力。而是否需要进行行业中性化处理与静态的两风险资产问题相关。我们推导出了进行行业中性化处理的最优情景。
实证表明数据符合我们的模型假设。此外,我们还测试了行业中性化后不同因子的预期收益变化。
虽然我们的分析模型没有预测行业分类的最优数量,但我们的实验结果表明,行业数量非常少(例如只有5个行业)往往是错误的。但同时行业数量过多会形成边际效用递减。此外,行业分类的数量与特定因子有关。
本文有两点值得注意:第一,我们运用均值方差理论所产生的实证结果是基于历史数据回测的。多空(纯多头)因子进行行业中性处理收益更高(更低)。这一点过去的研究也有过证实。但本文的重点在于我们展现了“为什么”:虽然实证分析是基于回测的,但我们的框架基于公司特征和行业特征的夏普比率及相关性,它可以用于预测回报。夏普比率和相关性会随着时间而变化,但本文的方法为主动管理的投资者提供了一个衡量指标,可以跟踪因子投资中行业中性处理的预期贡献。
第二个需要注意的点是均值方差模型本身。因为投资收益、包括因子收益通常是右偏的,但我们的测算是基于正态分布的,因此本文的结论在收益右偏的情况下未必成立,这块也是我们正在做的研究课题之一。