研报&论文

【方正金工】成交量激增时刻蕴含的alpha信息——多因子选股系列研究之一

由small_q创建,最终由small_q 被浏览 160 用户

本文来自方正证券研究所于2022年4月12日发布的报告《成交量激增时刻蕴含的alpha信息——多因子选股系列研究之一》,欲了解具体内容,请阅读报告原文,分析师:曹春晓 S1220522030005。

摘要

在股票市场中,成交量的边际变化隐含着非常重要的信息,特别是在技术分析领域,成交量被认为是股票市场的原动力。俗语“量在价先”深刻的反应了成交量的变化对于股票价格波动的预测具有指示性作用。本文中我们将尝试从成交量的边际变动出发,挖掘其对股票收益的潜在影响。

我们以利好信息为例,当一个利好信息公布后,可能会引起相应个股成交量的突然放大。如果在成交量激增的同时,价格却未发生变动,或者未能引起价格的波动,则表明这一利好消息没能得到市场广泛的认可。相反,如果成交量激增的同时,价格出现大幅上涨,则表明市场对于此利好信息反应过于趋同,有可能出现反应过度。

我们通过观察日内成交量激增的时段,考察这些时段的收益率与波动率,我们将与市场平均水平作为“适度”程度的衡量标准,进而构建“耀眼波动率”因子和“耀眼收益率”因子,并最终合成为能综合反应投资者反应不足和反应过度程度的“适度冒险”因子。

我们对“适度冒险”因子在月频选股效果上进行了回测,结果显示:合成之后的“适度冒险”因子表现非常出色,Rank IC为-8.89%,RankICIR为-4.84,多空组合年化收益率达37.46%,信息比4.10,因子月度胜率87.74%。此外,在剔除了常用的风格因子影响后,“适度冒险”因子仍然具有较强的选股能力,Rank IC均值为-3.18%,RankICIR为-1.89,多空组合年化收益率18.07%,信息比率2.23。

为了检验“适度冒险”因子在其他样本空间下的选股表现,我们分别选取了沪深300成分股、中证500成分股、中证1000成分股作为股票池,测试其选股能力,可以看到“适度冒险”因子在不同样本空间下均表现出较好的选股能力,相较而言,中证500指数成分股内表现更为出色。

风险提示

本报告基于历史数据分析,历史规律未来可能存在失效的风险;市场可能发生超预期变化;各驱动因子受环境影响可能存在阶段性失效的风险。

报告正文

1 引言

在股票市场中,成交量的边际变化隐含着非常重要的信息,特别是在技术分析领域,成交量被认为是股票市场的原动力。俗语“量在价先”深刻的反应了成交量的变化对于股票价格波动的预测具有指示性作用。

成交量的大小,可以衡量股票市场或者个股的活跃程度,并由此来观察买卖双方进入或退出市场的状况。本文中我们将尝试从成交量的边际变动出发,挖掘其对股票收益的潜在影响。

2 “适度冒险”因子定义逻辑

我们以利好信息为例,当一个利好信息公布后,可能会引起相应个股成交量的突然放大。如果在成交量激增的同时,价格却未发生变动,或者未能引起价格的波动,则表明这一利好消息没能得到市场广泛的认可。相反,如果成交量激增的同时,价格出现大幅上涨,则表明市场对于此利好信息反应过于趋同,有可能出现反应过度。

因此,当市场获得新的利好信息后,一方面我们希望此信息可以被市场广泛的认可和接受,推动股票价格稳步上涨;而另一方面我们不希望成交量的激增引起的价格变动太过剧烈,这样可能代表了投资者反应过度,导致股票短时间内涨幅过大,或者风险大幅加剧。正如Arnold,Pelster和Subrahmanyam(2022)指出,“那些吸引人们注意的股票,更容易诱发人们去承担过度的风险”。

综合以上两个方面,我们希望成交量激增能带来股票价格的适度变化与波动。或者说,我们希望那些认可利好消息的人,去适度地承担风险。

3 “适度冒险”因子构建与测试

3.1 成交量激增的定义

我们观察个股分钟频成交量的边际变化来定义成交量是否激增,具体如下:

1)剔除开盘和收盘数据,仅考虑日内分钟频数据,我们首先计算个股每分钟的成交量相对于上一分钟的成交量的差值,作为该分钟成交量的增加量。

2)计算每天每只个股分钟频成交量的增加量的均值mean和标准差std。

3)我们定义那些分钟频成交量增加量大于“均值+一倍标准差”的时刻为成交量激增的时刻,我们将对应的时刻统称为“激增时刻”。

4)举例来说,假设股票A在某天t的第9分钟、第10分钟、第88分钟、第200分钟的成交量增加量大于当天的mean+std,那么我们将第9、10、88、200这四个分钟统称为A股票在t日的“激增时刻”。

{w:100}{w:100}{w:100}

对于A股市场整体而言,投资者交易行为存在较为明显的时间特征,开盘之后成交量一般逐步下降,临近收盘再逐步提升。但对于个股而言,成交量的变化并不严格与此同步,成交量出现大幅变动的情况较为频繁。

{w:100}{w:100}{w:100}

我们以贵州茅台和宁德时代为例,根据上文中关于“激增时刻”的定义,我们分别对两只股票自2020年以来日内“激增时刻”做频数统计,可以看到两只个股日内“激增时刻”次数的平均值都是22次。进一步统计发现,对于大多数个股而言,日内的“激增时刻”次数均相对较多。从行业均值来看,国防军工、计算机、电子等行业成分股日内“激增时刻”较多,商业贸易、房地产、交通运输等行业相对较少。

{w:100}{w:100}{w:100}

{w:100}{w:100}{w:100}

3.2 激增时刻的价格波动

我们首先来考察成交量激增引起的价格波动,进而构造“月耀眼波动率”因子,具体过程如下:

1)我们定义“激增时刻”的这一分钟及其随后的4分钟,是因成交量激增而引起投资者关注的5分钟。投资者对成交量激增的反应,在这5分钟里表现得最充分最强烈,我们将这5分钟称为“耀眼5分钟”。

2)在上例中,如果第9、10、88、200分钟为“激增时刻”,那么对应的“耀眼5分钟”分别为第9~13分钟、第10~14分钟、第88~92分钟、第200~204分钟。

3)我们使用分钟收盘价,计算每分钟的收益率,进而可以得到每个“耀眼5分钟”里,收益率的标准差,作为成交量激增引起的价格波动率,我们将其称为“耀眼波动率”。

4)我们计算A股票在t日内所有“耀眼波动率”的均值,作为t日A股票对成交量的激增在波动层面上反应的代理变量,记为“日耀眼波动率”。

5)根据前述分析,我们希望“日耀眼波动率”不要太大,也不要太小,适度最好,为了不引入其他参数,我们此处选取“日耀眼波动率”的截面均值作为最“适度”的水平。因此我们将每日的“日耀眼波动率”减去截面的均值再取绝对值,表示个股的“日耀眼波动率”与市场平均水平的距离,并将其记为日频因子“适度日耀眼波动率”。

6)我们分别计算最近20个交易日的“适度日耀眼波动率”的平均值和标准差,记为“月均耀眼波动率”因子和“月稳耀眼波动率”因子。

7)将“月均耀眼波动率”与“月稳耀眼波动率”等权合成,得到“月耀眼波动率”因子。

{w:100}{w:100}{w:100}

接下来我们将对上述构建的月均耀眼波动率、月稳耀眼波动率以及月耀眼波动率因子进行单因子测试,我们在全A样本中按照月度频率进行测试,测试中对因子进行市值和行业正交化处理,测试区间为2013年4月至2022年2月(下同)。各因子表现如下所示。

{w:100}{w:100}{w:100}

从测试结果来看,月均耀眼波动率因子、月稳耀眼波动率因子以及合成之后的月耀眼波动率因子均表现出强势的选股能力,Rank IC分别为-6.60%、-7.87%、-7.63%。合成的月耀眼波动率因子多空组合年化收益率及月度胜率均更为显著,其分组表现如下图所示。

{w:100}{w:100}{w:100}

{w:100}{w:100}{w:100}

{w:100}{w:100}{w:100}

3.3 激增时刻的价格变动

接下来我们考察成交量激增引起的价格变动,进而构造“月均耀眼收益率”和“月稳耀眼收益率”因子,具体过程如下:

1)我们通过股票的每分钟收盘价,计算股票每分钟的收益率。

2)找到“激增时刻”对应的分钟收益率,例如上例中,第9、10、88、200分钟为激增时刻,那么分别对应着第9、10、88、200分钟的分钟收益率,我们将其称为“耀眼收益率”。

3)对A股票在t日内所有的“耀眼收益率”求均值,作为股票对成交量激增在收益率层面反应的代理变量,记为“日耀眼收益率”。

4)根据上述分析,我们同样希望“耀眼收益率”不要太大,也不要太小,适度最好。因此我们将每日的“日耀眼收益率”减去截面的均值再取绝对值,表示个股的“日耀眼收益率”与市场平均水平的距离,并将其记为“适度日耀眼收益率”。

5)我们分别计算最近20个交易日的“适度日耀眼收益率”的平均值和标准差,记为“月均耀眼收益率”和“月稳耀眼收益率”因子。

6)将“月均耀眼收益率”与“月稳耀眼收益率”因子等权合成,得到“月耀眼收益率”因子。

我们分别对上述因子进行回溯测试,可以看到“月均耀眼收益率”、“月稳耀眼收益率”以及合成的“月耀眼收益率”因子表现同样非常出色,其Rank IC分别为-8.62%、-8.00%、-8.53%,月度胜率分别为83.96%、87.74%和87.74%。

{w:100}{w:100}{w:100}

{w:100}{w:100}{w:100}

{w:100}{w:100}{w:100}

{w:100}{w:100}{w:100}

3.4 适度冒险因子合成

以上我们分别从波动率以及收益率角度构造了两个衡量“适度冒险”的因子,并发现其均具备非常强势的选股能力。我们将上述“月耀眼波动率”因子与“月耀眼收益率”因子合并,等权合成为最终的“适度冒险”因子,合成后的因子表现如下表所示:

{w:100}{w:100}{w:100}

合成之后的“适度冒险”因子表现非常出色,Rank IC为-8.89%、Rank ICIR为-4.84,多空组合年化收益率达37.46%,信息比4.10,因子月度胜率87.74%。

{w:100}{w:100}{w:100}

3.5 剥离其他风格因子影响后“适度冒险”因子仍然表现较好

从上述测试结果来看,“适度冒险”因子选股能力出色,进一步,我们测试其与其他常见风格因子的相关性,如下图所示,“适度冒险”因子与波动率和换手率有一定的相关性,与其他风格因子相关系数均较低。为进一步验证因子的增量信息,我们使用10个常用风格因子对“适度冒险”因子进行正交化处理,得到“纯净适度冒险”因子,再检验其选股能力。

{w:100}{w:100}{w:100}

{w:100}{w:100}{w:100}

可以看到,在剔除了常用的风格因子影响后,“适度冒险”因子仍然具有较强的选股能力,Rank IC均值为-3.18%,Rank ICIR为-1.89,多空组合年化收益率18.07%,信息比率2.23。

{w:100}{w:100}{w:100}

3.6 “适度冒险”因子在不同样本空间下均表现较好

为了检验“适度冒险”因子在其他样本空间下的选股表现,我们分别选取了沪深300成分股、中证500成分股、中证1000成分股作为股票池,测试其选股能力,可以看到“适度冒险”因子在不同样本空间下均表现出较好的选股能力,相较而言,中证500指数成分股内表现更为出色。

{w:100}{w:100}{w:100}

{w:100}{w:100}{w:100}

3.7 参数敏感性测试

我们将上述“耀眼5分钟”,改为“耀眼3分钟”或“耀眼4分钟”,即取“激增时刻”及其随后的2分钟或3分钟来重新计算因子,可以看到因子表现依然非常出色,参数敏感性相对较低。

{w:100}{w:100}{w:100}

4 风险提示

本报告基于历史数据分析,历史规律未来可能存在失效的风险;市场可能发生超预期变化;各驱动因子受环境影响可能存在阶段性失效的风险。

5 复现源码

\

标签

多因子选股股票市场多因子选股模型
{link}