本文对遗传规划提出了三个改进方向,进一步提升其因子挖掘能力本文是对华泰金工前期报告《基于遗传规划的选股因子挖掘》(2019.6)的补充和改进,目的是进一步提升遗传规划挖掘选股因子的能力。本文提出并测试了 3 个改进方向:(1)新的适应度指标——因子互信息和多头超额收益;(2)非线性因子的使用方法;(3)交叉验证控制过拟合。测试中展示了20 多个挖掘出的选股因子供投资者参考。通过方法论的介绍,本文旨在说明遗传规划或许能挖掘出大量因子(尤其是非线性因子),这对于能够利用非线性因子的机器学习选股模型来说具有重要意义。
新的适应度指标——因子互信息和多头
更新时间:2023-06-01 14:28
自2017年以来,多因子模型中常用的选股因子皆出现了不同程度的波动。因此,因子收益的预测就变得至关重要。
系列前期专题报告《选股因子系列研究(二十)——基于条件期望的因子择时模型》就对于常见选股因子收益的预测进行了初步讨论。模型样本外跟踪至2017年11月底依旧具有较好的表现。
结合模型实际跟踪经验与投资者交流反馈,本报告旨在对于因子择时模型进行改进与简化,希望得到一个易于理解、易于操作同时具有较强扩展性的因子择时模型。
由于需要讨论的内容较多,故而相关内容会在本文与《选股因子系列研究(三十一)——因子择时指标的选择》两篇报告中进行详细讨论。
条件期望因子择时模型2017
更新时间:2023-06-01 14:28
我们独家提出的APM因子模型,专注于考察上午(am)与下午(pm)的价格行为差异,并提取出有效的选股因子,在量化投资同行中获得了较好的评价。本报告的主旨是,基于APM因子模型的思想框架,对原始APM因子的改进再作深入的探讨。
APM因子在样本内(2013年5月-2016年10月)表现良好,五分组多空对冲年化收益为15.9%,期间最大回撤为2.52%,信息比率为2.84,月度胜率为78.6%,样本外(2016年11月-2019年12月)的表现略逊于样本内,多空对冲年化收益为6.41%,最大
更新时间:2023-06-01 14:28
自2017年以来,多因子模型中常用的选股因子皆出现了不同程度的波动。因此,因子收益的预测就变得至关重要。系列前期专题报告《选股因子系列研究(二十)——基于条件期望的因子择时模型》就对于常见选股因子收益的预测进行了初步讨论。专题报告《选股因子系列研究(三十)——因子择时模型改进与择时指标库构建》对于因子择时模型进行了改进并对于择时变量库的构建进行了讨论。本文将重点讨论择时变量的筛选以及择时模型的相关扩展应用
在2016年12月30日至2017年12月29日间,因子择时模型收益为12.3%,基准组合收益为-20.9%。
更新时间:2023-06-01 14:28
文献来源:Vyas, K., and Van Baren, M. 2021. Should equityfactors be betting on industries? The Journal of Portfolio Management 48(1),73–92.
推荐原因:资产管理公司越来越多地将非传统股票因子应用于选股。这些因子存在不同程度的行业暴露。部分选股因子会因行业暴露获取更高的超额收益,而有些则会降低收益。本文评估了价值、质量、动量、低波和规模等五大投资风格中的21个选股因子的行业配置效率。结果表明,同一投资风格的不同选股因子在行业配置上的回报表现出显著
更新时间:2023-06-01 14:28
A股呈现明显的市值效应和行业效应,不少选股因子的alpha也大部分来源于此。如果采用因子的原始数据和股票收益率做相关性检验,选出的股票会明显受到市场风格因素的影响,我们有必要从因子原始数据中剥离这些因素,检验因子是否能贡献行业、风格因素之外的alpha,本报告用新的方法对估值、成长、技术、风险四类因子过去十年的表现重新做了检验总结,并综合给出了最新的推荐选股因子。
估值类因子能够稳定地提供超额收益,但是高估值股票的负alpha普遍要比低估值股票的正alpha更为显著,呈现出明显的不对称超额收益,在A股市场缺乏有效的个股做空机制的情况下,难以充分获得估值类因子的alp
更新时间:2023-06-01 14:28
事件驱动策略的因子化。研究发现,分析师推荐、机构调研、限售股解禁等事件具有常见选股因子不能解释的超额收益。在多因子模型中引入事件因子,能够显著提升收益预测模型的精度与多因子组合的表现。
在现有的事件驱动策略因子化框架下,具有不能被常见选股因子解释的超额收益,超额收益对时间不敏感,发生股票数量较多、在时间序列上分布均匀的事件,在因子化的过程中,具有更好的效果。
事件驱动策略的评估往往以宽基指数为基准。超额收益既可能源于事件,也可能源于风格或其他因子。在多因子框架下,风格或其它因素的影响已经考虑在内,因此需要不能被解释的
更新时间:2023-06-01 14:28
找不到依赖的列:close_0avg_turn_0
选择换手率因子,是为了找流动性较好的股票,股性较为活跃。 选取资金流超大单因子,是为了增加短期买点的爆发力。 因为超大单因子的ic均值很高,而且存在一定的方向性,在牛市中有较为稳健的风格收益。
怎么解决呀!少了那个定义呀
https://bigquant.com/experimentshare/c73ca37a718648c7ac0951e25dee42fa
![{w:100
更新时间:2023-06-01 14:26
买入评级报告具有超额收益。截面回归模型显示,在控制了常见选股因子后,出现在买入评级报告中的股票仍然具有不能被解释的显著截面溢价。因此,买入评级报告具有积极的参考价值。
买入评级报告具有时效性。分析买入评级报告发布后1-12周的截面溢价,结果显示,越临近报告发布日,单位时间所获得的截面溢价越高。
不同报告类型的截面溢价存在明显差异。根据不同的报告类型构建对应的虚拟变量,并计算截面溢价:深度报告与调研报告的截面溢价始终高于全部买入评级报告的对应值;而一般个股报告的截面溢价与全样本数据接近;点评报告的截面溢价显著低于全样本数据。因此,深度报告与调研报告具有更高的投资参考价值,而点评
更新时间:2022-10-24 11:06
Level2类选股因子存在进一步挖掘空间。随着业界对于选股因子研究的深入,许多类别的选股因子都得到了较好的挖掘。但在众多研究中对于基于Level 2行情数据的选股因子的相关研究却少之又少,很多前期研究都将注意力集中到了Level 2类指标的短期选股效果上而并未对于该类指标在中长期上的选股效果进行研究。本报告旨在对于Level2行情构建的选股因子的选股效果进行初步的回测,为各位投资者进一步细化构建相关选股因子提供方向与灵感。
围绕逐笔数据可构建相关选股指标。逐笔成交数据从单笔成交金额以及单笔成交方向两个维度上为投资者提供了更多关于成交的信息。基于逐笔成交信息,我们可以掌握股票
更新时间:2022-10-12 07:18
研究结论
前言:本篇报告为东吴金工“波动率选股因子”系列研究的第二篇,受到学术界“股价波动与股票信息流”关系理论的启发,从“信息冲击”的角度出发,逐步构建了衡量“股票信息分布均匀度”的选股因子。
波动率与信息冲击:学术研究表明,股票价格的波动,与流入股票的信息流直接相关。借鉴前人研究经验,我们提出如下猜想:若股票信息匀速流入市场,则股价的波动相对较小;但若信息流入市场的速度发生剧烈变化,则会造成股价的波动迅速增大。因此,我们认为股价波动率大小的变化幅度,可以用来衡量信息冲击的剧烈程度。
信息分布均匀度UID因子:利用个股分钟数据,在计算每日高频波动率的基础上,构建信息分布均匀度UID因子
更新时间:2022-09-21 07:50
Level2类选股因子存在进一步挖掘空间。随着业界对于选股因子研究的深入,许多类别的选股因子都得到了较好的挖掘。但在众多研究中对于基于Level 2行情数据的选股因子的相关研究却少之又少,很多前期研究都将注意力集中到了Level 2类指标的短期选股效果上而并未对于该类指标在中长期上的选股效果进行研究。本报告旨在对于Level2行情构建的选股因子的选股效果进行初步的回测,为各位投资者进一步细化构建相关选股因子提供方向与灵感。
围绕逐笔数据可构建相关选股指标。逐笔成交数据从单笔成交金额以及单笔成交方向两个维度上为投资者提供了更多关于成交的信息。基于逐笔成交信息,我们可以掌握股票
更新时间:2022-09-20 03:19
传统多因子选股
在国内A股市场,传统的多因子量化选股模型得到了广泛的应用,在实际表现中,传统的多因子模型在过去几年中也表现出较为稳定的超额收益率。但随着传统多因子模型应用越来越广泛,历史长期有效的因子逐渐失效,对新因子的挖掘提出了迫切的需求。
新因子挖掘
传统的因子指标挖掘主要集中于财务报表、个股中低频率的价量等相关的数据维度,而这部分数据维度的增量价值的挖掘已逐渐饱和,需从其他新的数据维度中挖掘新的因子指标,本篇报告从个股日内高频数据出发尝试挖掘出新的因子指标。
基于个股高频数据的因子构建
本篇专题结合个股在微观市场结构中的特征,采用LSV模型
更新时间:2022-09-01 13:13
传统多因子选股
在国内A股市场,传统的多因子量化选股模型得到了广泛的应用,在实际表现中,传统的多因子模型在过去几年中也表现出较为稳定的超额收益率。但随着传统多因子模型应用越来越广泛,历史长期有效的因子逐渐失效,对新因子的挖掘提出了迫切的需求。
新因子挖掘
传统的因子指标挖掘主要集中于财务报表、个股中低频率的价量等相关的数据维度,而这部分数据维度的增量价值的挖掘已逐渐饱和,需从其他新的数据维度中挖掘新的因子指标,本篇报告从个股日内高频数据出发尝试挖掘出新的因子指标。
基于个股高频数据的因子构建
本篇专题结合个股在微观市场结构中的特征,采用LSV模型
更新时间:2022-09-01 13:07
本报告采用多类别logistic模型估计股票在未来1个月的大幅下跌概率,并以此作为选股因子;
在15%、20%、25%、30%、35%和40%等阈值计算下跌概率选股因子,因子在全市场的覆盖度在70%以上,在沪深300指数和中证500指数成分股里,因子覆盖度达到90%,在深圳主板、上海主板、中小板和创业板等四个板块的覆盖度基本保持在70%到80%之间;
经过行业和市值中性化后,在不同阈值下的下跌概率因子具体较好的选股能力,在全市市场里的ICIR均在0.5以上,t统计量在6以上,在不同板块和指数成分股里均保持较高的统计显著性;
Crashp1m40_zj因子的IC衰减速度较慢,与
更新时间:2022-08-31 06:27
近年来,随着因子投资的兴起,因子拥挤(Factor Crowding)也逐渐受到投资者的关注。所谓因子拥挤,是指由于跟踪或者投资某一因子的资金过多而使得该因子的收益性或者收益稳定性下降的现象。由于这一现象的存在,度量因子拥挤度就显得至关重要
在系列专题报告《选股因子系列(四十二)——因子失效预警:因子拥挤》以及《选股因子系列研究(四十三)——因子拥挤度的改进》中,我们已经对因子拥挤度指标的构建进行了深入讨论。考虑到因子拥挤度的度量指标并不仅仅局限于系列前期报告所涉及的4类指标中,本文尝试引入了更多的拥挤度指标,希望能够为搭建因子拥挤度监控框架的投资者提供更多的参考。
资产集中
更新时间:2022-08-31 02:19
传统多因子Alpha模型大多是在全市场范围内对股票一视同仁地进行打分评价,忽视了个股之间的基本面情况差异和选股因子在不同风格股票池里的适用性,能够捕捉不同股票之间差异性的动态情景模型(Dynamic Contextual Alpha Model)应运而生, 并且在海外市场获得了优异的业绩。
本文借鉴了国外同行的先进经验,并根据中国A股市场作出了相应调整,将全市场的股票按照规模、估值、成长、盈利能力和流动性水平进行了划分,并且在不同的股票类型中采取最优的因子权重配置方式,构建了一套动态情景alpha模型。
实证检验表明,动态情景alpha模型能够更加精确地捕捉横截面
更新时间:2022-08-31 01:49
本文作为“猎金”系列报告的第二十篇,我们将继续对基本面Alpha因子的探索,本文我们将通过对上市公司盈利质量的定量刻画,来构建相应的选股因子。 我们用上市公司利润中应计利润的相对规模的大小来衡量上市公司的盈利质量。通过回归分析,我们发现A股上市公司营业利润呈现明显的均值回归的特征,且Sloan(1996)的假设在A股市场同样成立,即现金流部分对营业利润的贡献比应计利润部分对营业利润的贡献更具有持续性。 原始的应计利润因子在全A中表现平平,但在剔除亏损及行业中性的条件下,应计利润因子表现有了大幅提升,IR提升至0.23,对应t检验统计量提升至2.85;多空组合Sharpe比率提升至0
更新时间:2022-08-23 02:00
本文主要对剔除高频多因子空头组合后的沪深300指数增强策略进行回测分析。
构建高频多因子空头组合的方法。从因子复合与组合复合两种角度出发,本文共探讨了3种构建高频多因子空头组合的方法:因子复合-zscore加总、因子复合-回归模型、以及单因子空头组合复合。相对应的剔除样本空间中多因子空头组合的方法分别称之为:zscore复合剔除、回归复合剔除以及组合复合剔除。
高频因子的形式。由于高频因子正交风格和行业后,空头效应更为稳定,因此在构建高频多因子空头组合时更建议采用正交因子形式。此外,为更好地反映高频因子在成分股以外的空头效应,建议将构建复合因子的样本范围限制在标的指数
更新时间:2021-11-26 08:57
更新时间:2021-10-06 09:02