常见量化投资策略
由clearyf创建,最终由clearyf 被浏览 211 用户
导语
简单来讲,量化投资就是利用计算机科技并采用一定的数学模型去实现投资理念、实现投资策略的过程。
量化交易 是指借助现代统计学和数学的方法,利用[计算机技术来进行交易的证券投资方式。量化交易从庞大的历史数据中海选能带来超额收益的多种“大概率”事件以制定策略,用数量模型验证及固化这些规律和策略,然后严格执行已固化的策略来指导投资,以求获得可以持续的、稳定且高于平均收益的超额回报。
量化投资模型只是一种工具、一种方法、一种手段,能实现成熟而有效的投资理念,需要不断根据投资理念的变化、市场状况的变化而进行修正、改善和优化,换而言之,有效的模型建立在适应市场环境的有效投资思想上。量化投资不是靠一个投资模型就能永远赚钱,而且也不是使用一个模型就能解决一切问题,更不是一个模型就能胜任任何市场状况。
量化投资策略以正确的投资理念为根本,通过各种因素的分析,以全市场的广度、多维度的深度视角扫描投资机会。相比于被动型投资策略而言,量化投资更偏向于主动投资。而相比于传统的基本面和技术分析主动投资方式而言,因为利用了计算机技术从而更高效、更有执行力。此外, 传统的主观定性投资大部分时间是在预测市场的方向,例如寻找可能翻倍的股票;而量化投资策略大部分精力花在分析套利机会,例如哪里是估值洼地,哪一个品种被低估了,买入低估的,卖出高估的。
量化投资分为:阿尔法策略、低风险套利、统计套利、程序化CTA、高频交易等。
量化投资从本质上讲是通过研究各个因素与未来收益之间的关系,试图寻找较大概率获胜的机会。通常而言需要综合考虑资产的鉴别(个股选择、行业配置、资产配置等)、交易(包括择时)和风控(包括对风险收益的平衡等〕等方面因素,寻找到成功概率最大的投资组合,达到收益最大化。因此,其研究内容囊括了:量化选股、量化择时、股指期货套利、商品期货套利、统计套利、期权套利、算法交易、ETF/LOF套利、高频交易等各个方面。股票市场的量化交易的核心投资思想包括宏观周期、市场结构、估值、成长、盈利质量、分析师盈利预测、市场情绪等多个角度。
综上所述,量化投资的主要思想是挖掘数据的变化背后的信息。如果数据永远不会改变那么就没有信息。价格数据的变化反应并包含了信息,可以认为每个数据都是一个因子表达式,其背后也对应了一个假设或者投资模式。例如:收盘价close这个因子表达式,背后的假设就是股价越高未来收益越大,代表了高价股赚钱的一种投资模式。由此衍生出一种投资策略就是买高价股,卖低价股。我们将这种策略/因子表达式也称为Alpha。
一个非常复杂的系统会表现出某种程度的可预测性。市场不断诞生有效的alpha(投资模式)并随着资金的介入而逐渐缩小,直到其逐渐失效。但这一过程将在市场上引入/创造其它的模式,从而诞生新的alpha。
Alpha的典型来源如下:
- 价格/成交量
- 基本面
- 宏观数据
- 文本:如期刊、新闻、会议记录、社交媒体信息
每个回报来源都来自一个风险源,因此任何投资组合都可以被看作是风险的组合。 理想的投资组合将保持对任何一个广为人知的风险因素(Beta)的零负荷,以及对他所能发现的尽可能多的未知因素(Alpha)的非零负载。而搜索新alpha的过程中,需要不断拷证alpha的稀缺性/背后的逻辑/规模和持久性。
Alpha的研究过程
开发Alpha
阿尔法逻辑→数据形式的信息→想法→数学表达式→应用操作→最终稳健的α→转换为金融工具中的头寸→检查历史损益,其他性能度量(信息比、周转率、回撤等)。
检验Alpha
检查alpha的健壮性主要考察:
- 高样本内信息比
- 良好的样本外信息比
- 最大回撤、回撤时间等方面
- 每日成交量,用来衡量调整投资组合的速度
- 总收益/交易总额,用来衡量每交易1元钱所得的利润
一个好的alpha应该尽可能地分布在尽可能多的行业上,而不是过于集中。此外分层回测也是检验alpha的一个好方法,可以辅助我们查看alpha的头部或者尾部的预测能力。如果多空收益大部分来源于头部分组的盈利,那么如果头部分组收益下降就可能对此阿尔法的性能造成较大的影响。
但是,我们不应该仅仅根据历史测试模拟结果来做判断。原因有以下几点:
- 当前的市场与历史时期不一样,市场规则可以改变,投资主体、新理论、新技术也会发生变化。因此, 测试周期越长越好,这是不一定正确的 。
- 模拟假设可能不是真实的 。交易过程可能会影响市场,需要支付交易成本或佣金。在评估模拟结果时,对这些数字的合理估计至关重要。
- 可能的前瞻性偏见 。 如果你看到有人追随趋势并获利,那么你可以测试趋势跟踪模型,也许你可以得到一个很好的历史模拟。 没有更好的理解,你可能会或可能不会在未来的投资中获利。
- 过度优化 。 有时候会看到很好的模拟结果,可能只是随机误差或噪声,但没有预测能力。在更长的历史中测试模型,在更广泛的市场中测试模型,都有助于降低过度拟合的风险。不幸的是,在现实世界中,存在着限制。没有一个系统的方法来提高夏普比率。要么没有足够长的可用历史数据,要么市场发生了变化,历史也发生了变化。与机器学习模型类似,如果alpha的参数较少,模型对参数变化的敏感性较低,这有助于降低过度拟合的风险。
敏感性测试和显着性测试是很重要的。 一个好的α信号应该对噪声不敏感。测试稳健性的最常用技术包括对不同时间段、不同持续时间、随机数据子集、每个股票部门等的数据进行测试,我们对那些对这些输入变化不敏感的信号更有信心。另一方面,每个输入数据都应该对结果作出重大贡献。检验显着性的最简单方法是删除一个输入变量,并检查结果是否有显着变化。如果每个输入变量都做出了重大贡献,则我们更好地信任信号。
此外, 当样本外Alpha的数量增加时,样本外的测试也可能有偏差 。
改进Alpha
- 去除原始数据的异常值
- 改变数据表达方式 例如: 将一个绝对数量含义的变量转化为当前值与其历史值的比值,用来表示该变量的变动
- 数据的中性化处理 通常市场风险和行业风险是最大的风险,我们通过中性化保证每个行业内的alpha总和为0,同时保证全市场的所有股票alpha的总和为0,这样可以有效消除市场风险和行业风险从而降低最大回撤,提高信息比率。此外通过采用alpha值的rank可以进一步提高信息比率。如果换手率偏高,可以通过利用衰变(时间尺度上的长周期均匀化)在一个时间窗口内平均这个alpha。
- 提高alpha的鲁棒性 排序:使用因子的排序将原始alpha转换到[0,1]区间 分位数:使用因子分位数 Fisher变换:将原始alpha转换为近似服从正态分布。 Z变换:将原始alpha转化为零均值和单位标准差的分布。
Alpha研究中的算法技术
AdaBoost
在α研究中,我们经常处理弱分类器/预测器,通过对弱学习者学习适当的加权函数,可以在很多情况下利用机器学习的概念,从几个弱学习者中培养出一个强学习者。
数字滤波
α研究还涉及时间序列数据的处理。从数字信号处理中提取的时间序列可以有效地去噪时间序列数据,并将时间序列分解为趋势和周期分量。 最简单和最广泛使用的数字滤波器是简单的移动平均线;数字滤波的另一个流行应用是将时间序列分解为趋势和周期分量。趋势提取涉及抑制高频分量(低通滤波),而周期提取涉及抑制低频分量(高通滤波)。
特征提取
α研究的另一种感兴趣的技术是特征提取。 诸如主成分分析(PCA)/聚类之类的算法有助于减小特征空间的维数。本文介绍了量化模型构建的基础—因子,简要介绍了因子构建、检验和组合中常见的问题和技术,更多的内容建议参考社区内容寻找市场中的Alpha,平台提供的模板策略相比于传统量化而言采用AI技术对因子信息进行处理因而能够产生更优的策略效果。选取多少因子合适,训练集选多长等问题,通过本篇的介绍相信您已经有了初步的想法了。
\