Two Sigma：序列深度学习与量化投资

由crisvalentine创建，最终由crisvalentine更新于2021-12-07 05:10 被浏览 241 用户

导语

近日，来自Two sigma AI Core团队的David Kriegman教授进行了题为《Deep Learning for Sequences in Quantitative Finance》在线分享。David Kriegman是加州大学圣地亚哥分校的计算机科学与工程教授，也是计算机视觉的专家。他于今年1月份加入了Two Sigma AI Core团队。

正文

量化投资对很多人来说似乎很神秘，以至于大家经常把投资过程本身称为一个“黑盒子”。此外，量化投资的复杂性不断增加，如今Two Sigma和其他公司经常在过程的各个部分使用强大的深度学习技术，根据大量数据做出决策。

即便如此，这个过程也不一定像人们有时想象的那样神秘。David kriegman教授在本次网络研讨会，阐明Two Sigma研究人员如何将序列深度学习应用于量化投资。

正如David Kriegman解释的那样，量化投资过程地分为特征提取、预测单个资产的收益、投资组合配置和交易执行等步骤。这个过程中的许多步骤可以很容易地表示为机器学习问题，可以使用序列深度学习方法解决。

序列深度深度学习的输入是一个单维或多维的序列，如RNN就是典型的用于序列预测的深度学习模型。在很多领域都有序列预测的需求，比如情感分析、图像标注、翻译等等。

图片来自：Two Sigma{w:100}{w:100} 接下来的分享分为两大部分：第一部分介绍了Two Sigma的量化投资的流程线，以及各流程中与深度学习结合的过程；第二部分介绍了常见的用于序列预测的深度学习模型。

传统的因子体系的投资框架将策略构建的过程分为了特征提取、预测单个资产的收益、投资组合配置和交易执行等步骤。在这些步骤中，如特征提取、资产收益预测及交易执行中，都用到了序列预测。

可以看到，这还是一个传统的因子模型的构建流程，只不过在不同的流程中找到了深度学习的应用场景。所以整体还是基于传统投资框架，用深度学习进行局部优化与提升。在我们之前介绍的念空超级信号工厂（念空的『超级信号工厂』）也采取了一样的框架体系。

图片来自：Two Sigma{w:100}{w:100} 在Feature Extraction与Alpha Modeling的步骤中，原始输入的因子可以来自多个维度，包括量价指标、基本面数据、情绪数据及非传统信息源。通过大量的数据结合序列深度学习模型，对资产未来的收益进行预测。

图片来自：Two Sigma{w:100}{w:100} 有了对于单个资产的收益预测，接下来就是组合构建，需要确定每个资产在组合中的占比。虽然这不是一个序列预测的问题。但组合优化本身也可以结合机器学习的算法，需要考虑非常多的限制条件，及选取合适的目标函数。这本身是一个大规模的优化问题。

图片来自：Two Sigma{w:100}{w:100} 最后，在交易执行层面，为了尽可能的控制交易成本，对于未来价格的预测也是一个序列预测的问题。与Feature Extraction与Alpha Modeling预测相对中长期的资产收益率不同的是，交易执行过程中预测的是跟高频的价格变动、成交量变动，以达到最优的执行成本。这当中需要考虑多个因素：订单量大小的选择，交易所的选择及订单类型的选择等。

图片来自：Two Sigma{w:100}{w:100} 在第二部分序列预测深度学习模型的介绍中，David Kriegman从基础的RNN介绍到了LSTM。也提到了近年来序列预测模型的热点，主要包括：Transformer和Attention。当然CNN也更多的用在了序列预测的问题上。

对于新手，一个可行的序列预测的学习路径就是：RNN-LSTM-Attention-Transformers-各种新Paper。

图片来自：Two Sigma{w:100}{w:100} 最后作者也分享了强化学习的相关应用，强化学习完全是一个端到端的应用。主要在游戏和机器人领域取得了很大的成功。强化学习本身需要强大的算力及模拟器。但在量化投资的应用并没有深度学习那么广泛。

总结

通过本次分享，可以看出深度学习在顶尖对冲基金的应用：

深度学习有用，且已经成为主力
坚持传统投资框架，在不同的流程中找到深度学习的应用场景
基础设施、海量数据同等重要

Two Sigma：序列深度学习与量化投资

导语

正文

总结

标签