高频因子构建:4、进阶玩法之存中介表优化窗口函数性能
由small_q创建,最终由small_q 被浏览 61 用户
高频因子加工,本质上就是将日内的高频信息降频为日频,有些因子在降频为日频后,还要向前取移动平均,例如5日、20日
以20日移动平均为例,一个低效率的方式是,加工高频因子时,取数据就多取20天的,以一天5000只票240分钟为例,这种取数据就要取到5000 X 240 X 20 = 24,000,000 条数据
但是一个更高效的方法是,加工高频因子时,只取一天的数据,高频因子加工好后村一个临时表,之后在临时表中计算20日滚动平均,这样的话,取数据就只需 5000 X 240 X 1 + 5000 X 20 = 1,300,000,效率有很大提高
我们以分钟交易量方差,再取20日移动平均为例,对比两种方式
\