量化选股的数据来源无外乎财务数据、量价数据、预期类数据以及部分另类数据(文本、网络热度、专利、新闻情绪等)。除了另类数据的探索之外,传统数据加工方法的创新化也是探寻新Alpha的路径。
我们从公司财务能力的四大衡量维度入手(偿债能力、营运能力、盈利能力、企业发展能力),分别选取有代表性的指标作为公司财务能力的衡量维度,进一步引入计算公司财务能力相似度的方式,相似度高的公司股价应具有一定的协同效应。在此基础上,我们构建了财务动量因子(简称为F-Momentum)去衡量这种协同效应,并研究该因子的选股有效性。
从测试结果来看,F-Momentum因子IC达到0.027,ICIR达
更新时间:2021-11-26 08:38
线性多因子体系是量化选股的基石,传统的Fama三因素模型,以及后来提出的五因素模型均是在多元线性回归的框架下去探讨因子在选股层面的有效性。当选定的线性模型存在比较严重的多重共线性时,由此构建的选股模型将变得极不稳定。因此,在多元线性框架下进行研究时,多重共线性是我们必须要考量并想办法解决的重要问题!
惩罚性线性回归通过引入对系数的惩罚,进而降低或消除一些自变量对回归方程的影响,从而达到控制模型多重共线性的目的。我们以惩罚线性回归模型Lasso、Adaptive Lsso、ElasticNet为核心对因子进行筛选,并构建复合选股因子。结果显示三种方法均表现出了较强的选股能力,但多
更新时间:2021-11-26 07:43
机器学习容易给人“黑箱模型”和“过拟合”的印象,但事实上一些机器学习算法的逻辑和结果都非常直白,而且算法自身带有一套避免过拟合的参数估计机制。众多的实践研究说明,机器学习方法的预测能力大部分情况下都强于线性模型,很值得在量化投资中测试使用。本报告主要讲述机器学习的基本原理和用其来做量化选股的实证结果
机器学习模型众多,不存在所谓的最强模型,不同的数据,不同的问题适用不同的模型。我们测试了LASSO、SVM、增强型决策树、随机森林等几种常见机器学习方法,最终选择用随机森林,主要是因为它结构简单、参数少、过拟合概率低,同时还具有非常强的样本外预测能力
机器选股模型省去了“因子筛选”、“因子加权
更新时间:2021-11-22 07:53
当前应用于NLP领域的Transformer,结构过于庞大,并不适用于股票数据(开盘价,收盘价,最高价,最低价,等)这样的时序数据,因此,本文提出一种简化的适用于股票数据的Transformer结构,其根据时间嵌入的思想构建,能很好的应用于量化选股中。下面以一个例子来介绍用于股票数据的Transformer体系结构,以及
更新时间:2021-02-03 07:05