海通金工-高频因子的现实与幻想
由qxiao创建,最终由qxiao 被浏览 239 用户
时间:2020 年 07 月 30 日
分析师:冯佳睿 袁林青 姚石 罗蕾 余浩淼
摘要
高频行情数据蕴含丰富的信息,但市场上少有对此类数据的特征及如何应用的详细介绍。本文从高频行情数据的组成和结构出发,系统整理了十几个既有经济学逻辑, 又表现良好的因子,并通过多因子指数增强模型展现其实践价值。
Level2 行情数据概况
Level2 行情数据是目前国内证券市场上对于交易信息包含最为完整,颗粒度最为精细的行情数据产品。主要有 4 种形式:分钟 K 线、盘 口快照、委托队列、成交明细。Level2 行情数据已覆盖在沪深两市上市的股票、 可交易型基金、沪深交易所指数等大量品种,还在积极扩展纳入 ETF 期权等沪深 交易所上市的衍生品,基本可以满足对 A 股市场的研究、投资和交易需求。
基于分钟成交数据的高频因子
根据分钟 K 线包含的信息,可构建高频偏度、下行波动占比、尾盘成交占比、量价相关性、改进反转、平均单笔流出金额占比、 大单推动涨幅,共七个因子。它们的月均 Rank IC 都在 3%以上,年化 ICIR 都大 于 3。其中,尾盘成交占比因子表现最优,月均 Rank IC 为 4.86%,年化 ICIR 为 3.59。
基于 TICK 委托数据的高频因子
盘口委托挂单数据刻画了投资者的买入意愿,开盘后 30 分钟内的委买增量越大,投资者在这段时间内的买入意愿越强。开盘 后净委买增额占比因子月均 Rank IC 为 4.19%,年化 ICIR 为 4.24。
基于逐笔成交数据的高频因子
根据逐笔成交数据中的“买”、“卖”标记和单号信息,可构建开盘后净主买占比、开盘后净主买强度、大买成交占比、开盘后知 情主卖占比,共四个因子。它们的月均 Rank IC 分别为 3.31%、4.46%、4.35%、 2.86%,年化 ICIR 分别为 2.51、3.29、1.96、2.51。
基于 TICK 委托与逐笔成交数据的高频因子
委托挂单体现投资者尚未释放的交易意愿,而主买/主卖则代表已进行的交易行为。若将两者结合,可以得到广义的 投资者主动买入意愿。开盘后买入意愿占比因子和开盘后买入意愿强度因子的月 均 Rank IC 分别为 4.34%和 5.07%,年化 ICIR 分别为 3.43 和 3.93。
高频因子在多因子组合中的应用
常用的在多因子模型中引入高频信息的方式有两种,一是在个股收益预测模型中直接加入高频因子,二是利用高频因子剔除空 头个股。对于沪深 300 指数、中证 500 指数和中证 800 指数,同时使用这两种 方法后,均可将指数增强策略的年化超额收益提升 2.6%以上。并且,在时间序 列上也较为稳定。在绝大部分年份中,引入高频因子后的策略都优于基准策略。
正文
/wiki/static/upload/ab/ab93ab39-2cff-46fe-8923-01b8a6fdf946.pdf
\