使用随机森林的自动选股(SSRN-3978532)
由crisvalentine创建,最终由crisvalentine 被浏览 99 用户
论文原名
《Automated Stock Picking using Random Forests》
论文作者
克里斯蒂安·布赖通-慕尼黑工业大学
修订时间
2021 年 12 月 7 日
引言
我们通过在国际流动股票数据集上应用基于技术特征的随机森林模型来得出股票排名。基于此排名的同等加权多空投资导致高达 2.33 的卓越夏普比率。我们观察到最小方差投资组合产生了更大的夏普比率 (3.46),我们可以追溯到建议的股票排名,因为我们没有观察到这种对随机构建的投资组合的影响。
此外,我们实现了显着的 alpha,因为 Fama 和 French 的五因子模型的动量扩展版本中包含的任何风险因素都无法解释优异的表现。结果对投资组合规模、区域限制是稳健的,并且不受个别异常值的驱动。
关键词
选股、机器学习、随机森林、投资组合
简介
挑选未来表现优异的股票是资产管理公司面临的挑战之一
作为主动投资需要准确的回报估计,不同的研究人员分别提出预测模型。与有效市场假设 (EMH) 一致,这些模型中的大多数无法预测未来的股价走势。在一项综合研究中,韦尔奇和戈亚尔(2008年)表明绝大多数建议的模型不仅在样本外表现不佳,而且也在样本中。随着计算能力的提高,研究人员开始应用机器学习算法——使用支持向量机等模型预测短期股价趋势的方法刘等。, 2016)、深度学习(Dos Santos Pinheiro 和 Dras , 2017 年)) 或集成模型 ( Basak等。, 2019) 取得了可喜的成果。有些人不是预测向上或向下的运动,而是研究人员还试图预测个股的回报是否高于某些股票绝对回报门槛。例如,米洛舍维奇(2016年) 将股票定义为“好”,如果它们在-次年至少增加 10%。最近,Gu 等人。(2020年) 比较使用传统模型预测未来的神经网络和随机森林的性能股票价格,并发现机器学习模型确实优于传统模型。他们认为这种过度表现可能要追溯到机器学习的能力捕捉非线性模式的算法。
除了选股之外,资产经理还尝试确定优化投资组合的收益率波动率,这个问题已经在内部进行了大量研究上世纪中叶以来的学术界(班等人。(2018年),德米格尔等人。(2009年) 和贾根-弥敦道和马(2003年))。当马科维茨(1952年) 提出了均值方差的概念Portfolio,从业者很快发现样本外表现不佳,作为方法需要对难以想出的未来回报进行良好的估计。为了规避这个问题,一些研究人员建议投资最小方差投资组合(MinVP)作为预期收益不进入优化目标。但波动性下降通常伴随着投资组合回报的下降。因此,两者都建议生成的优化策略通常无法实现比同等加权更高的夏普比率样本外的投资组合。虽然这两个主题都已在个人基础上进行了广泛的讨论,但尽我们所能知识,我们是第一个将投资组合优化策略应用于衍生的股票排名通过随机森林。而不是预测未来的回报(崔等人。, 2020),我们提出了一个模型基于识别跑赢大盘的技术特征,股票收益率高于平均水平返回。
我们的方法具有三个主要优点
首先,我们认为所提出的模型解决了一个相当不那么雄心勃勃的问题,因此可能会产生更好的预测结果。
第二,与莫里茨和齐默尔曼相反(2016年) 谁使用基于树的模型来推导投资组合排序,我们通过计算表现优异的概率得出更精细的股票排名在安全级别。
最后,我们在更大的时间范围内训练我们的模型,其中包含看涨和看跌的市场环境应该会产生更可靠的预测。
我们避免随着时间的推移重新拟合我们的模型,因为这使我们能够评估发现的随着时间的推移,模式仍然很有价值。我们首先计算模型偏好的等权重投资组合的表现(顶级投资组合)超过十五年的时间范围并将其与投资组合的表现进行比较基于表现出众的可能性很小的股票(底部投资组合)。
我们发现强有力的证据表明,所提出的模型产生了有价值的股票排名。同等权重顶部投资组合不仅明显优于底部投资组合,而且收益率更高夏普比率高于所有随机构建的投资组合。夏普比率为 1.4850 只股票的投资组合,顶级投资组合的表现也明显优于 MSCI 世界指数(0.33)。进一步允许对底部投资组合的空头投资导致更高夏普比率为 2.26。当使用计算出的表现出色的概率作为替代指标时预期回报,我们实现了更高的多头 (1.66) 和多空 (2.52) 夏普比率投资到均值方差投资组合。
我们进一步观察到,夏普比率随着投资组合规模的增加而增加,导致多空的夏普比率高达 3.46最小差异投资组合,最大投资金额为 100,相比之下为 2.33对于一个同等权重的人。虽然波动性可以降低大约 50%,但回报率仅下降了 25%。我们认为这种影响可以追溯到股票排名,因为我们在应用最小值时观察到更高的回报下降随机构建投资组合的方差方法。
我们进一步注意到,在 Fama 的动量扩展版本中没有任何风险因素法国五因素模型可以完全解释优异表现,导致非常显着不计交易成本的年度阿尔法高达 26.28%。这些发现有力地表明,合并 Machine 时,投资者可能能够获得显着更高的夏普比率通过投资组合优化技术学习引导式选股。我们的结果不仅对投资组合规模稳健,而且对区域限制也很稳健,表明选股方法也适用于发达的金融市场。我们进一步发现我们的投资方法的盈利能力没有显着下降最近几年。
最后,我们建议另一种模型驱动的投资策略,它需要投资组合周转率大幅降低,而收益仅略低。使用这个另类策略,由于持有期较长,不建议做空投资假设股票贝塔系数为正,这是无利可图的。本文的其余部分安排如下。首先我们介绍一下识别第2节中的策略,然后我们在第3节中介绍数据集和一些构建的特征.结果在第4节中评估,然后在之前的第5节中进行一些稳健性检查我们得出结论
PDF原文
/wiki/static/upload/ad/ad6d314c-2ae5-4c0d-8e35-343464b2d1a0.pdf
\