研报&论文

“学海拾珠”系列之八十六:基金业绩预测指标的样本外失效之谜

由small_q创建,最终由small_q 被浏览 10 用户

报告摘要

主要观点

本篇是“学海拾珠”系列第八十六篇,本文分析了基金业绩预测指标的样本外表现,许多业绩预测指标在样本外的效果衰减程度很大。这些衰减主要是市场上套利活动增强的结果,而基金的竞争似乎起到了次要作用,没有发现由于数据窥探或投资者“学习”导致效果衰减的证据。回到国内基金市场,常用的一些基金业绩预测指标在市场某些时候确实会发生失效的现象,我们需要考虑市场套利活动、基金竞争对业绩预测指标预测效果的影响,指导我们构建投资组合。

计算alpha spread来衡量业绩预测指标样本内外的效果差异

以两种方式衡量样本内外alpha spread,即通过排序和横截面回归。基于排序的alpha spread是根据预测指标分组后,Q5和Q1组合alpha之间的差值(Q5-Q1)。也使用横截面回归来构造alpha spread指标,记为 “CSR ”alpha spread,即回归系数。

结果表明,样本外的alpha spread要低得多。对于Q5-Q1,从每月21.9bp下降到每月8.6bp,对于CSR alpha spread,中位数从8.4bp降至仅3.3bp,预测指标的样本外效果仅为其样本内效果的39%。

alpha spread在样本外为何衰减?

本文提出了几种可能,例如有可能是由于数据窥探偏差、投资者/管理者的“学习”效应、市场套利活动的变化、基金竞争程度的变化,通过分析发现,套利活动的影响随着时间的推移而加强,导致基金的alpha值逐渐向零衰减,在控制了套利活动后,所有关于样本外alpha衰减的证据都消失了,套利活动在所有回归中都是显著的,而竞争在某些回归中表现出显著性,似乎是改变alpha预测性的次要解释。

风险提示

本文结论基于历史数据与海外文献进行总结;不构成任何投资建议。

简介

回归结果显示,基金公司规模与基金业绩呈负相关,实地调研频率与基金业绩显著正相关。因此中等规模的基金公司,实地调研次数越多,基金绩效越好

基金研究中的一个核心问题是,扣除费用和成本后,具有正alpha的基金是否能在事前与具有负alpha的基金区分开来。这要求投资者的信息集中的某些变量与未来的alpha值相关,一些文献已经研究了各种能预测未来基金alpha的指标。这些alpha预测指标能否在其原始样本之外表现依然优秀,是本文回答的一个重点问题。

一个变量在样本外的预测能力可能与它在样本内的预测能力不同,原因有很多。也许是由于期刊倾向于统计学意义上的结果,数据窥探偏差将导致样本内预测能力的上升,在样本外预测能力自然会下降。另外,样本内和样本外的市场条件不同,如用于套利活动的资本金的变化或基金行业规模的变化,可能导致所有投资者找到非零alpha的能力不同。最后,投资者如果从发表文章中了解到收益预测指标,随着这些指标被更多人知道,他们的行为可能会降低这些指标的预测能力。

在这三个原因中,数据窥探可能是最常被讨论的一个。当特征排序的投资组合是根据以前对相同数据的分析而选择的时候,对特征的分析会产生特别大的数据窥探的可能性(Lo和MacKinlay(1990))。一些基于会计计算的股票市场异常现象很可能是数据窥探的结果,因为这种基于异常现象的策略在样本期之外的表现很差(Linnainmaa和Roberts(2018))。

第二个原因,市场有效性或竞争的趋势或波动导致alpha预测指标的有效性随时间变化。例如,随着套利活动总量的增加,个别资产的alpha值可能会缩减为零,基金的alpha值也会因此而缩减。Chordia、Subrahmanyam和Tong(2014)研究了资产定价异象的回报(动量、价值、应计费用等)与各种套利活动指标的关系,发现随着套利活动的增强,许多超额收益衰减了。

基金产生alpha的能力会受到来自其他基金的竞争的影响,这些基金可能遵循类似的策略并追求类似的错误定价资产。如果投资风格相似的基金数量增加,特定基金的业绩表现可能会恶化(P´astor、Stambaugh和Taylor(2015))。另外,竞争也可以帮助清洗表现不佳的基金,所以竞争效应可以在正反两方面影响alpha。

最后一个原因是学习,本文考虑了投资者从学术文献中学习并根据文献修改其投资决策或管理风格的可能性。学习可能通过几种机制降低某些特征预测未来alpha的能力。其一是投资者从已发表的研究中受益,能够更好地识别具有正负alpha的基金,从而导致流向正alpha基金和流出负alpha基金的资金增加。规模收益的下降意味着这些流动将这两种类型的基金都推向零(Berk和Green(2004))。另外,基金公司可能通过提高好基金的管理费和降低劣基金的管理费来应对投资者偏好的变化。

本文的第一个主要结论是,alpha预测指标很大程度上在样本外没法表现得和样本内一样好。文献中提出的预测指标所产生的alpha spread,至少有一半在样本外消失,在某些情况中,下降的幅度明显更高。因此,对于潜在的基金投资者来说,学术文献中关于持有何种特征基金的建议可能比宣传的无用得多。

本文的第二个主要结论是,市场范围内的套利活动或基金之间的竞争在时间序列上变化可以解释这一些现象。Chordia, Subrahmanyam,and Tong (2014)研究中所使用的的套利活动指标的变高与alpha预测性的大幅下降有正相关。基金行业规模的上升似乎也会减弱alpha预测性。Hoberg、Kumar和Prabhala(2018)提出的竞争度指标也有一些解释力。

当本文在同一回归中纳入样本外或公布后的影响、套利活动变量和竞争变量时,只有套利活动仍然稳健显著。以及虽然不那么稳健,但基金的竞争,似乎也推动了基金业绩预测能力的下降(Hoberg、Kumar和Prabhala(2018))。

原文也分析了债券基金,以提供另一个可能不受数据窥探偏差影响的样本,虽然这种资产类别不同,但与股票基金业绩相关的一些相同特征可能会转化到债券基金。虽然本文能够分析的预测指标受到债券基金持仓数据的限制,但本文发现有强有力的证据表明,在整个样本期间,大多数alpha预测指标对公司债券基金也是有效的。这意味着,文献中确定的基金业绩与alpha预测指标之间的关系不太可能是由于数据窥探导致的,且同样发现,套利活动越多,alpha spread越低。

基金alpha预测指标

研究表明,基于过去基金收益的各种业绩衡量标准可以预测未来的业绩表现(Hendricks, Patel, and Zeckhauser (1993))。Carhart(1997)证实了这些结果,但发现他自己的四因子模型中的过去alpha在预测未来风险调整后的业绩方面更有用。也有一些研究利用其他基金或非基准被动投资组合的收益来改善对基金alpha的估计。

有几个业绩指标是基于最近基金持仓形成的投资组合的alpha分析。例如,Elton, Gruber和Blake(2011)认为,基于持仓的投资组合的alpha值比从基金自身收益计算的alpha值更能预测未来的基金收益。基金持仓已经被用来构建各种其他的投资组合特征,这些特征已经被证明与基金业绩有关。Grinblatt、Titman和Wermers(1995)表明,持有高动量股票的基金往往表现相对较好。Chan,Chen和Lakonishok(2002)利用持股数据,从持股规模和PB来描述基金的特征,发现成长型基金往往提供更高的基准调整后的回报。

继Berk和Green(2004)之后,许多研究都关注基金规模对业绩的影响。Chen等人(2004)发现,规模较大的基金业绩较差,尤其是小盘股基金,而基金家族规模与业绩呈正相关。Pollet和Wilson(2008)认为,基金应该通过更加多元化发展来缓解规模收益递减的影响,多元化确实与未来基金业绩有关。

还有研究考察了基金费用和成本的影响,包括显性和隐性的。Elton等人(1993)发现,费用与未来的基金业绩呈负相关,这一结果被Carhart(1997)在一个更全面的样本中证实。Bergstresser、Chalmers和Tufano(2009)表明,经纪商销售的基金业绩低于直接销售的基金,这部分是(但不完全是)经纪商销售的基金收取高额分销费用的结果。

总共来自25篇论文的27个不同的alpha预测指标被纳入本文的分析。

基金样本

本文从证券价格研究中心基金(CRSP MF)数据库中获取1961年11月至2015年1月的基金回报(月度)和基金特征,如费用、总净资产(TNA)、基金组合换手率和投资风格。基金收益扣除了费用。本文重点关注主动型美国股票基金。样本排除了基金首次发售日期之前的观察值,那些在CRSP MF数据库中缺少基金名称的观察值,以及那些基金的TNA低于1500万美元的观察值。为了防止在使用持股数据时出现异常值的影响,本文要求基金至少持有10只股票才有资格进入本文的样本。本文将每只基金的多个股票类别结合起来,重点关注TNA加权后的总股票类别。

本文的最终样本从1961年11月到2015年1月,包括3,069只基金,样本中基金的平均样本月数为147个月。

计算alpha spread

本文遵循Carhart(1997)的做法,根据因子betas的滚动估计计算alpha值。具体来说,对于每只基金的每个时间,使用前36个月的数据来估计Fama和French(1993)以及Carhart因子的betas,然后用这些betas对当月的超额收益进行风险调整,计算结果称为“已实现alpha”,标记为 图片{w:100}

本文集中研究基金alpha的差异,这是通过测量基金alpha和一些基金预测指标之间的关系得到的,其中i下标表示基金,j表示预测指标。为了简洁起见,本文把时间定为t,但注意预测指标总是在月末时已知。预测变量的定义是:高值代表表现良好,低值代表表现糟糕。

本文以两种方式衡量alpha spread,即通过排序和横截面回归。基于排序的alpha是通过对 图片{w:100}进行排序,并计算Q5和Q1的等权组合alpha之间的差值得到的。简而言之,本文把这个差值表示为“Q5-Q1”。本文也使用横截面回归来产生alpha spread。在这种方法中,事后基金alpha对个别预测指标进行单变量月度回归,这些预测指标会做标准化。这些回归的斜率系数即“CSR ”alpha spread(cross-section regressionalpha spread)。

特别说明,本文有两个预测指标(经纪人销售指标和基于持仓的成长基金指标)总是取值为0或1。对于这些预测指标,Q5-Q1的差异即两个投资组合等权平均alpha之差,而“CSR ”alpha spread则是通过对这些指标进行横截面回归来计算的。

鉴于本文将在面板回归中使用CSR系数,回归分析中预测指标的归一化是必要的。如果没有归一化,不同预测指标方差的差异将导致CSR系数的巨大偏差,这与预测的强度无关。预测指标的归一化具有使不同预测指标的CSR系数在时间序列均值和方差方面合理地同质化的作用。

本文认为,这两种类型的alpha spread衡量都很重要。横截面回归使预测指标的分散性最大化,这有可能使预测指标值非常大或非常小的基金对估计的差异有更大的影响。但是,如果预测指标和alpha之间的关系是非线性的,这就不可取了,此时根据五分组计算差异更有意义。选择哪一种方法更合适尚无定论,本文把它们都包括在内。

纳入预测指标的门槛

本文的目标是了解27个预测指标的样本外表现,所以本文必须首先记录样本内表现。本文遵循McLean和Pontiff(2016)的做法,要求预测指标在样本内表现优异,即样本内平均alpha spread的t统计量高于1.5。对于极端分位数(Q5-Q1)的结果,这个t统计量是根据样本内Q5-Q1的差异计算的。对于横截面回归(CSR)的结果,t统计量是基于CSR的差异。

基金的文献中包含了许多不同的方法来评估一个预测指标的有效性。这些方法包括根据一些分类变量对投资组合进行比较,其中投资组合的数量通常在3到10个之间,每个投资组合可能是等权或价值加权。基于回归的方法也很常见,可以使用面板或Fama-Macbeth框架,并对序列相关和异方差进行调整或不调整。此外,回归可能包括控制变量,本文在自己的分析中不包括这些变量。最后,对基准或因子风险的调整在不同的论文中处理得非常不同,早期的文献,在某些情况下,侧重于原始回报,而自Carhart(1997)以来的大多数论文都使用该论文的四因子模型。

图表1显示了本文所考虑的27个预测指标中每个因子的分析结果。使用原始论文中的样本期,27个预测指标中有18个的t统计量超过1.5,估计系数与原始研究中的系数一致,为基于分位数(Q5-Q1)的结果。在剩下的9个预测指标中,有4个符号正负与原始研究一致,但没有达到1.5的t统计量临界值,有5个的估计值不显著,且符号与原始研究中的符号相反。对于基于横截面回归(CSR)的结果,18个预测指标是显著的,且符号匹配,尽管它们与基于排序的分析下的显著性不尽相同。剩下的9个中有5个具有匹配的符号,但并不显著,而4个则是不显著的,符号相反。

图片{w:100}

图表1还显示了在原始研究中使用的样本期之外的数据中,预测指标层面的alpha spread的表现。在绝大多数情况下,在样本中具有显著性的alpha spread在样本外和公布后的时期都比较低。这促使本文在下一节进行更系统的分析。

样本外业绩表现

本文回答的核心问题是,基金的alpha预测指标是否在样本外继续发挥作用。本文通过几种方式解决这个问题。本文首先效仿McLean和Pontiff(2016)的做法,分析alpha spread在原始样本期之外如何变化。然后本文考虑一个框架来分析基金指标的预测性。

预测指标的描述性统计

本文首先分析预测指标的alpha spread,即Q5-Q1差异或CSR系数。图表2显示,在本文的Q5-Q1结果中包含的18个预测指标中,在其各自的样本期中有246个月的数据,在样本期外有216.5个月的数据。大多数样本外数据是在原始研究的样本期结束之后,但对于18个预测指标中的7个,本文有一些数据是在最初使用的样本之前。当前期样本数据存在时,它们平均有108个月的观测值。相比之下,采样后的数据平均为139个月。

样本内alpha spread通常都相当大。对于Q5-Q1差异,所有18个预测指标的中位数是每月21.91个基点,中位数t统计量是3.1。对于CSR的alpha spread,其中预测指标已被归一化,具有零平均值和单位标准差,因此,8.39的样本内值意味着,一个预测指标增加1个标准差,就会使基金的alpha每月增加8.39个基点,t统计量的中位数是3.14。

样本外的alpha spread要低得多。对于Q5-Q1差异,中位数下降到每月约8.6个基点,中位数t统计量为2.01。对于CSR差异,中位数从8.4降至仅3.3,中位数t统计量为2.31。

该表还显示了样本外和样本内alpha spread比率的中值。对于Q5-Q1,比率中值为0.39,这意味着典型的预测指标的样本外alpha值仅为其样本内alpha值的39%。对于CSR,中位数比率类似,为0.38。

本文分别检查了样本前和样本后的时期,以确定在样本外时期的哪一部分alpha spread下降最多。本文发现,对于可以分析的七个预测指标,Q5-Q1的样本前alpha spread大大增加,约为样本内值的1.52倍。样本前CSR差异只是略小。因此,样本外alpha spread的下降似乎完全来自于样本后时期。

本文还考察了alpha预测指标公布后的表现,并单独考虑了样本后、公布前的部分。虽然只有14个预测指标有公布后的数据,但无论是Q5-Q1还是CSR 差异,这些样本上的表现通常与样本后的数值相似。在样本后、公布前的窗口期,alpha spread低于公布后的数值,这些时期相对较短(中位数为57.5个月),因此对此结果持谨慎态度。

图表2还揭示了alpha spread在样本期内的演变情况。对于每个有可用数据的预测指标,本文分别检查了1992年初之前和之后的平均alpha spread,在这个断点之前和之后,中位预测指标的样本内月数大致相同。无论是Q5-Q1还是CSR的结果,中位预测指标在1992年之前的样本内部分的alpha spread都略高于整个样本内的中位数,而1992年之后的样本内差异中位数则较低。这一结果表明,alpha spread在大多数研究的样本期间都会衰减,而不仅仅是在这些样本期间结束之后。

最后,该表显示平均样本内和样本外alpha spread是如何受到风格的影响。本文根据市值和账面市值比率的持股加权平均百分比,将基金划分为一个2×2的风格网格。对于每个日期,本文通过减去同一风格的所有基金的同期平均数,除以同一组基金的同期标准差来重新衡量。使用这些经过风格调整的预测指标来代替未经调整的预测指标,就会产生表中最后两栏的结果。

由于风格调整需要基金的持股数据,而这些数据只从1980年开始提供,所以样本会短一些。然而,风格似乎对本文的任何主要结果都没有什么影响,这表明基金业绩预测指标的力量在很大程度上与投资风格无关。

图片{w:100}

预测指标的面板回归

这一小节重新评估了基金预测指标在面板回归中的样本外表现。

这一结果见图表3,它首先分析了回归中的alpha spread(以每月的基点为单位)。

图片{w:100}

其中 图片{w:100}是预测指标的alpha spread, 图片{w:100}是一个指标变量,如果在首次提出预测指标的论文中使用的原始样本期之外,则取值为1。本文包括有和没有预测指标固定效应( 图片{w:100})的结果。当包括预测指标固定效应时,标准误差按日期聚类,以考虑预测指标alpha之间的同期交叉关系。当不包括固定效应时,本文另外按预测指标分组,以说明不同预测指标之间的持续差异。

首先关注使用预测指标固定效应的结果,每个小组的第一个回归显示,对于Q5-Q1和CSR,从样本内到样本外的下降,分别为-11.82和-4.47。值-11.82表示五分位数的平均差异在原始研究的样本期之外,按月下降了近12个基点。值-4.47意味着在样本外,预测指标增加1个标准差的影响每月减少4.47个基点。这些数值比图表2所示的数值要小一些,但它们仍然显著。

接下来,本文把样本外时期分成样本前和样本后两个子时期,以区分数据窥探和其他假说。按照Linnainmaa和Roberts(2018)的说法,数据窥探应该导致两个子时期的alpha spread都降低,而例如学习的解释将意味着只有在样本后才会下降。与图表2的结果一致,alpha spread在样本后较低,但在样本前较高,尽管样本前的影响只在Q5-Q1有统计学意义。

在图表3中,本文首先研究了出版效应,用出版后的指标取代样本外指标,发现出版后的下降接近于样本外的下降,而且比样本外的效应略大。然后,本文把样本外和出版后的指标都包括在内,这样,出版后的指标就能捕捉到alpha在出版后的下降,超过了样本外的任何下降。本文发现,无论是Q5-Q1还是CSR,两个系数都是负的,尽管公布后的影响更大,更有意义,这表明相对于数据窥探,学习的作用更大。

对学习的另一种看法是,alpha spread可能会逐渐下降,也许在发表前就开始下降,并随着对研究的认识逐渐加深而继续下降。本文试图通过增加一个捕捉逐步衰减的回归因子来捕捉这种可能的动态。

图片{w:100}

其中 图片{w:100}是预测指标j的最后一个样本内时期。使用这个“采样后衰减”变量进行回归的结果是负系数,这意味着alpha spread在原始样本期结束后逐渐减少。

该表还包括没有预测指标固定效应的结果,这些结果稍显薄弱,在某些情况下显示出统计意义的丧失。然而,这些回归结果提供了有力的证据,表明在样本期结束后,alpha spread出现了下降,无论是使用采样后或公布后的虚拟变量还是采样后的衰减变量来衡量,结果都一致。

总体而言,图表3的结果进一步加强了图表2中结果的解释力。样本外的alpha spread比样本内的要小得多,下降似乎完全来自于采样后时期,样本前时期的alpha spread较高,并有一些证据表明在原始样本期结束后逐渐下降,这并不支持数据窥探的解释。

图片{w:100}

基金层面的面板回归

在本节中,作者在基金层面的面板回归中分析了基金alpha的样本外预测能力。

为了理解本文的基金层面的回归,首先想象一下,如果本文只使用一个单一的alpha预测指标,本文可能会运行一个回归,

图片{w:100}

在这个回归中, 图片{w:100}代表的是根据基金的预测指标(假定在t日之前已知)的日期t的分组。例如,如果该基金根据预测指标处于Q1,则得分可能为-1,如果处于Q5,则得分可能为+1,处于中间三组的基金得分为0。c=0对应的情况是预测指标的样本外影响与样本内影响没有变化,而d=0表示没有出版效应。

本文的回归省略了 图片{w:100}图片{w:100}的直接影响,这些影响只有在与分数变量交互作用时才被包括在内。这是因为本文的回归还包括时间固定效应,它将吸收这两个指标和任何其他只表现出随时间变化的变量。然而,无论是否包括这两个指标的直接影响,当本文去除时间固定效应时,本文的结果几乎没有变化。

有了多个预测指标,本文必须对可预测性的聚合方式做出假设。本文的做法是,简单地假设alpha与所有预测指标的平均分数有关。如果有N个预测指标,本文假设

图片{w:100}

其中j系数表示预测指标。在这种设定下,c=0意味着样本外的预测能力没有恶化,d=0意味着发表后没有进一步的下降。

本文考虑了两种不同的分数变量 图片{w:100}的设定。一种是上述的极端五分法,即处于Q1的基金得到-1分,处于Q5的基金得到+1分。这与本文先前结果中的Q5-Q1方法大致对应。另一个分数等于某个基金的预测指标的百分位数,在同期横截面上重新调整为介于-1和+1之间。这与CSR结果更相关,但并不类似。本文尝试了其他定义,发现对本文的结果影响不大。

为了控制基金之间的持续差异,本文的第一个设定包括基金固定效应和时间固定效应。本文还在回归中加入了文献中常见的基金费用(每月基点)和规模(资产管理规模的对数)的控制,并从用于计算基金分数(方程(1)中的 图片{w:100})的预测指标列表中删除这两个变量。在很大程度上,基金固定效应似乎代表了费用率,它是非常持久的,也可能代表了规模效应。这两个控制因子有可能是基金固定效应的适当替代。

图表4为结果,在A组第一栏中,平均得分×OOS指标的-64.29系数(来自(1)的c系数)意味着,在样本外期间,预测指标平均为0.2的基金(大约处于第75百分位),其月度alpha值将下降64.29×0.2≈13个基点,或年化1.5%。当本文把样本前和样本后时期分开时,只有后者才会发现有统计学意义的可预测性降低的证据。同样地,当这些变量被逐一纳入时,发表后效应和采样后衰减效应都是显著的。使用风格-时间固定效应的证据较弱,表明基金alpha的样本外和公布后的变化主要是基金内部的现象。

总结本节提出的证据,本文发现样本后alpha预测性降低,但本文发现没有样本前的下降,而且有一些证据表明样本前的预测能力有所增加。因此,“学习”的解释似乎得到了稍大的支持。

图片{w:100}

时变的套利活动与基金竞争

对样本外alpha spread减少的另一个解释是,随着时间的推移,市场有效性的提高使得alpha的产生(无论是正还是负)更加困难。另外,由于基金之间竞争程度的增加,基金产生非零alpha的能力可能已经下降,那么也许规模扩大导致的竞争加剧也会降低本文分析的alpha预测指标的能力。竞争也可能存在截面差异。

套利活动和alpha

考虑市场层面套利活动的三个不同指标——总做空比例、股票总换手率和对冲基金资产总规模。美股的总做空比例是月度市值加权做空量除以前一个月底的流通股,据跨度为1973年1月至2014年12月。股票总换手率是以前一年年底的市值为权重的月度市值加权的股票成交额。月度股票换手率是月度股票成交额除以前一年底的市值,数据跨度为1961年1月至2014年12月。对冲基金的总资产规模是对冲基金每月管理的资产(AUM)按纽约证券交易所和美国证券交易所股票在前一个月底的市值计算的,数据跨度为1977年3月至2014年12月。

本文认为,去趋势化是有用的,因为它们有可能识别出无法用简单的市场有效性趋势来解释的效果。同时,如果市场随着时间的推移,由于套利活动的整体积极趋势而变得更加有效,那么去趋势化将消除驱动alpha动态的一些变化。虽然经济论点似乎倾向于不去趋势化,但本文同时考虑去趋势化和不去趋势化两种情形。

此外,本文通过对三个指标进行平均,创建一个综合套利活动指标。由于做空比例和对冲基金资产管理规模分别从1973年和1977年开始才有,所以综合指标在1973年之前只包括换手数据,在1973至1977年之间只包括换手和做空比例数据。在平均前,先把每个套利指标除以自己的标准差,这样每个系列指标对总指标的贡献就差不多了。

本文在前面所述的基金层面框架内研究套利活动的作用。在这种方法中,预测指标平均计算,

图片{w:100}

对每个基金在每个时间t,并进行回归,

图片{w:100}

其中 图片{w:100},在t日开始时已知,是上面讨论的套利活动指标之一或综合指标。负的c系数表明,更大的套利活动降低了预测指标和未来收益之间的预测关系的强度。本文报告了带有时间和基金固定效应以及带有风格-时间固定效应的结果。

图表5的结果显示,套利效应在每个回归中都是显著的。对于所有的套利指标,无论是否去趋势化,较高的套利活动与可预测性的降低有关,即当套利活动较高时,预测指标与基金alpha的正相关程度明显降低。这一结果对百分位数和基于极端五分位数组以及两种固定效应的设定都成立。

此外,系数估计值在经济意义上较高。在所有设定中,系数的范围在-15到-30之间。处于Q4的基金,其基于百分位数的平均得分约为0.2。对该基金来说,系数为20意味着套利活动的1个标准差的增加与年度alpha值的0.5%的下降有关。

图片{w:100}

基金竞争与alpha

前文所述的套利指标主要是衡量来自基金行业之外的力量。然而,基金的alpha也可能受到该行业内竞争程度的影响。

P´astor and Stambaugh(2012)认为,基金的业绩会随着主动管理型权益基金的管理资产总额上升而下降。Hoberg,Kumar和Prabhala(2018)通过分析基金在特定规模/价值/动量区域的竞争对手的密度,找到了业绩与风格竞争相关的证据。

本文考虑四种不同的竞争衡量指标,并研究它们如何影响alpha的可预测性。第一个是行业总规模,遵循P´astor的研究定义为所有主动管理的美国股票基金的AUM总额除以所有CRSP普通股票的总市值。第二个是风格规模,计算方法类似,每种风格都单独计算。如前所述,风格的确定是基于2×2的规模/价值网格。第三和第四个是Hoberg、Kumar和Prabhala(2018)的NPeers(同行人数)和TSIM(总相似度)测量值。前者只衡量持有类似规模/价值/动量的同行的数量,而后者则考虑到了相似程度。

图表6中的分析结果显示,所有四个竞争衡量指标在单独纳入回归时与alpha预测性都有显著负关系。当同时纳入所有四个变量时,似乎受到自变量冗余的影响。

图片{w:100}

对于这些影响的程度,当使用A组第一个回归中的行业规模系数估计值-301.23,可以估计,行业规模增加0.01会使该基金的月度alpha值减少约0.6基点(-301.23×0.01×0.2)。相比之下,P´astor等估计,同样的行业规模的增加会使基金的平均alpha每月减少约3个基点。

采取类似Hoberg,Kumar和Prabhala(2018)的做法,一个处于高竞争三分位的基金可能比低竞争三分位的基金多100个同行。对于一个平均百分位数为0.2的基金来说,A组中的第三个回归意味着同行数量的这种变化的影响大约为每月2.4个基点(-0.12×100×0.2)。相比之下,Hoberg,Kumar和Prabhala(2018)估计,高低三档之间的平均α值差异约为每月7-8个基点。因此,对alpha spread的竞争影响是显著的,但相对于平均alpha的估计影响而言,其幅度并不大。

重新审视样本后的实证结果

在这一节中,本文要问的是,样本后预测性的下降是否有可能与随时间变化的套利活动或基金竞争相一致,而不是与数据窥探或学习效应相一致。为了回答这个问题,本文考虑了同时包括样本后效应和套利活动和/或竞争测量的设定。如果样本后效应仍然显著,这将表明原始研究的样本期是重要的,要么是由于数据挖掘,要么是由于学习。如果包括了套利或竞争测量驱除了样本后效应,那么本文可以得出结论,基金alpha的可预测性下降与数据窥探或学习关系不大,而与市场有效性或竞争的整体上升有关系。

在基金面板回归中考虑以下模型,

图片{w:100}

其中,b系数捕捉预测指标和alpha之间的基础关系,c衡量样本后的衰减效果,d捕捉与本文的套利活动测量值 图片{w:100}的关系,e和f评估行业规模(ISize)和(TSIM)测量值的影响,g捕捉平均分数和时间趋势之间的关系。本文包括带有时间和基金固定效应以及带有风格-时间固定效应的回归。

回归结果如图表7中报告。首先,在控制了套利活动后,所有关于样本后衰减的证据都消失了,套利活动在所有回归中都是显著的,其系数估计值与图表5中的相似或更大。行业规模可以解释样本后已实现alpha的部分变化,但当两个变量都包括在内时,它被套利活动所取代。最后,TSIM的显著性不受其他预测指标的影响,尽管只是在不包括基金固定效应的设定下。

总的来说,证据显示随时间变化的套利活动的影响很大,竞争似乎是改变alpha预测性的次要解释。套利的力量似乎随着时间的推移而加强,导致基金的alpha值逐渐向零缩减。没有令人信服的证据表明alpha预测性在样本后的下降是由于数据挖掘或学习造成的。

图片{w:100}

启示

鉴于alpha的可预测性已经下降,这对基金投资者意味着什么?相关的问题是,正向alpha是否已经减弱或变得更少。

本文通过分析被预测为具有最佳未来表现的基金组合的表现来研究这个问题。这些预测是基于对整个基金小组的估计模型。在每个月的月初,本文利用滞后信息,根据图表8中A组的最一般的设定估计(包括基金和时间固定效应),计算出每个基金的预测alpha。在对预测的alpha值进行分类后,本文形成了一个由前五分之一的基金组成的组合。然后,本文通过对组成基金的已实现alpha进行平均计算,来计算该组合的已实现alpha值。

图片{w:100}

本文感兴趣的是,这些已实现的alpha是否随着时间的推移而下降了。由于它们在每个月的基础上都有很大的噪音,本文采用了两种不同的平滑策略。一个是检查10年的移动平均数。另一个是检查样本分割,本文测量不同断点之前和之后的平均alpha。

图表9显示了这一分析的结果。上图显示,第一组的投资组合在本文的样本期开始时,每月有大约30个基点的高度显著的alpha值。在样本期结束时,该值已下降到每月10个基点。

Panel B显示了在不同断点上分割样本的结果。对于每个断点(其数值出现在横轴上),本文计算一个“回望”平均值,包括断点之前的所有数据,以及一个“未来”平均值,包括断点上或之后的所有数据。分割点的选择使每个子样本至少包含12个月。

回望平均数总是大于未来平均数,表明无论选择哪一个断点,投资组合的未来表现总是不如过去。本文样本中的最后五年实际上平均alpha已为0。Panel C显示了回望和未来平均之间差异的相应t统计量。对于2000年后的大多数断点,其差异是显著的。

本文的结论是,虽然一些alpha可能仍然存在,但它远远低于历史平均水平,而且可能已经完全消失。

图片{w:100}

结论

本文发现,在样本外基金alpha的大部分可预测性都消失了。这种情况很可能是套利活动增加的结果,而不断变化的基金竞争或许起到了次要作用。Chordia、Subrahmanyam和Tong(2014)已经证明,本文所考虑的套利活动指标(做空比例、股票换手率和对冲基金资产管理规模的总体衡量指标)与资产定价异常现象(如规模和动量)的缩小有关,并且可能是更普遍的市场有效性程度的代表。本文发现,这些指标对基金alpha也很重要,并在很大程度上解释了基金产生alpha的能力的下降。在控制了套利之后,本文发现没有证据支持数据窥探或学习效应。

投资者至少使用其中的一些指标来指导投资组合的选择。更根本的是,更大的套利活动对基金alpha的抑制作用可以解释一些经验性的规律,包括基金alpha的下降(Barras, Scaillet,and Wermers, 2010),对冲基金的崛起,以及基金行业的指数化趋势。最后,本文的结果强调了在收益可预测性方面考虑时间变化的重要性。

文献来源

核心内容摘选自ChristopherS. Jones和Haitao Mo在《The Review of Financial Studies》上的论文《Out-of-Sample Performance of Mutual FundPredictors》

风险提示

本文结论基于历史数据与海外文献进行总结;不构成任何投资建议。

\

{link}