机器学习实战系列之三:截面融合模型选股框架初探-长江证券-20180311
由qxiao创建,最终由qxiao 被浏览 74 用户
摘要
截面融合模型选股框架设计
截面融合模型包括三个部分:选择合适的特征空间,选取特定的模型簇,确定融合规则。目前常见的机器学习模型选股多将全部因子作为输入,以单个训练的模型作为预测结果,而截面模型框架通过在特征空间和函数空间进行选择,将多个特征空间下的多个函数簇在特定目标确定的规则下进行融合,达到更加逼近预测关系的结果。
筛选的多个子空间比全空间表现更好,且可以很好捕捉非线性关系
本文从特征子空间和多个解释空间这两个角度出发验证筛选因子空间的有效性,从超额收益、夏普比、信息比、多空夏普比和Calmar比上进行对比,多个大类行业的子空间的策略表现显著优于全空间策略。筛选的有效子空间中包含很多线性模型中非显著的因子,捕捉数据中存在的非线性
分组标准的融合结果优于传统R方标准的融合结果
以样本内第一组选股组合的收益情况为标准(分组标准)的融合结果相比于传统R方为标准的融合结果,在超额收益、超额最大回撤、夏普比、信息比、多空夏普比、Calmar比上均得到了显著的提高。
截面融合模型的表现优于单个机器学习模型、线性回归模型
本文以提升树、ExtraTrees、随机森林、Ridge回归和Lasso回归为基模型,以线性加权的形式对模型进行融合,得到截面融合模型,在全A市场的选股中,超额收益为20.03%,超额最大回撤为7.27%,信息比为2.93,相比于单个机器学习模型和线性回归模型,其超额收益、夏普比、多空夏普比和Calmar比均有显著提高
截面融合模型可以更好的捕捉因子的非线性关系
我们将截面融合模型与线性模型预测结果回归的残差定义为非线性效应因子,以该因子在全A股中进行选股分组显著,呈现较为明显的线性,长期看来并无明显失效的时期,其中第1组的年化超额收益为6.56%,夏普比为0.72,信息比为1.14,Calmar比为0.36,表明截面融合模型可以捕捉一定的因子非线性关系
正文
/wiki/static/upload/a7/a72467e5-1c4a-4584-8590-c610dd7ad840.pdf
\