研报&论文

超量子基金 张晓泉:《量化的未来:理解和应对不确定性》文字实录

由iquant创建,最终由qxiao 被浏览 39 用户

“4月29日,由华泰证券、宽邦科技、亚马逊云科技、朝阳永续、金融阶等多家市场权威机构联合组织撰写的《2021年中国量化投资白皮书》正式发布,并在深圳举办发布会。超量子基金创始人张晓泉出席会议并作题为《量化的未来:理解和应对不确定性》的演讲,我们对文字进行实录,以飨读者。” 感谢今天的主办方,今天我也给大家带来一些干货,是我们自己团队经常思考的一些底层逻辑问题。

{w:100}

01

刚才基本上每位演讲者都提到了量化的内卷,量化的未来在哪里? 先给大家讲个故事,二战1940年代,德国开发了恩格玛机的加密密码器,因为密码机的加密方式的复杂性和情报的及时性,理论上只有24小时破解每密码的时间,如果一天没有完全破解的话,第二天密码换了就得重新开始。 所以英国当时找了很多破密的人,图灵就说了一句话:”我不想去做暴力破解,我希望开发出底层逻辑的东西,这样的话有任何的密码、信息,我都可以及时地破解。” 图灵从数学的角度提出全新的方法论,用了逻辑计算一种底层逻辑的方法来计算,最终大获成功。 故事触发了我们对量化未来的想象。 量化1.0,Fama-French三因子线性模型。 量化2.0,机器学习非线性关系。 量化3.0,我们认为是数理统计+机器学习+经济金融模型三样东西的结合。 这张图就解释了为什么要将这者结合起来,因为他们的目标是不一样的。经济金融模型的目标是做解释,要把底层的逻辑搞清楚。机器学习就是暴力,我不需要知道底层逻辑,只要做预测就好。数理统计是更好地描述数据,这三者缺一不可。 {w:100}

如下,纵轴是预测能力,传统的机器学习会希望把预测能力往上推。横轴是经济金融理论,希望能解释现象,把底层的逻辑搞清楚。预测与解释有时候是矛盾的。比如地心说预测能力很强,但是解释能力很差。它能预测太阳东升西落,但它的解释能力、底层逻辑是错的。而进化论解释能力很强,预测能力就很差。进化论能解释清楚人为什么从猴子一直进化到现在,但是人未来长成什么样子,难以预测。量化的未来,我们推演还不够,没有做到极致。 {w:100}

02

今天我给大家分享一下我们超量子的投研体系,我们的底层哲学。 金字塔最顶端是资管业务,很简单,风控、交易、资管业务任何私募都会有。 第二层也是量化私募通用的,金融工程、机器学习、模型、因子、策略。 再往下还有两层,都是超量子致力提高的。第一层是Science科学,数学、建模、统计工具,其中统计工具是从底层开发新的统计学模型,去对金融底层的数据做更深刻的理解,从而消除过度拟合,产生因果关系的模型。 再下一层还有art艺术的部分,是对不确定性的理解、对价值的思考、对人性的洞察、对优雅的追求。 {w:100}

03

我们认为每个人对世界的看法都可以拆解成很多小的逻辑,世界一共就4种状态:均衡态、循环态、随机态、复杂态。 其中均衡态就是小球放在碗里,推一推它还会回到碗底。 循环态就是不管东西怎么绕,到后来一定会回来,比如经济有周期。 随机态也是一种状态,没法预测,但他会产生随机的数据。 复杂态就如同蝴蝶效应,一个很小的扰动都会导致最后的结局非常不一样。

{w:100}

这4个状态在金融市场里都是存在的,我们的目标是寻找办法把它拆解出来,从底层去理解这些状态。 比如人的身高,如果用正态分布去描述的话,会描述得比较准确,如果用幂律分布,结论就很容易错。所以模型是死的,最重要的是我们这些人应该用什么样的逻辑方法去描述这些数据。 股票数据也是如此,尖峰厚尾,但我们现在用的模型大多数是基于正态分布,能不能去跳出正态分布找新的底层,从科学层面去理解金融数据呢?

04

概率分布实际上经常不存在,很多人对不确定性的理解还不够深刻,认为不确定性就是波动率,波动率一高,不确定性就上来,但并非如此。 Laplace1814年就说概率分布在很多场景下都不存在,比如战争、选举、研发、婚姻、投资… 怎样去统计这些概率,Laplace认为当不知道某一事项概率的时候,会认为所有的概率都相等,这就明显不对了,因为如果用正态分布还有一些信息,如果用均匀分布就是没有信息,很难做统计推断。 所以不确定性有几个级别? 确定性就是我从这里面随机抓小球一定是黄色的,如同太阳东升西落是确定的。 风险是明天有70%的概率股市会涨,30%可能跌,30%会跌就是是我的风险? 黑天鹅是说可能有非常小的概率,产生我之前想不到的结果。 第四个是风险之外的不确定性,但是目前没有统计学和数学的工具对其度量,如同我知道明天股市要么涨、要么跌,但我不知道概率分布。 {w:100}

以上四种风险哪种更贴近真实股市的描述? 主流金融模型现在用的模型都是第二个,但实际上是第四个,我们不知道分布,而且需要有数学工具去解决它。

05

结果不确定性与分布不确定性,这两种不确定性是必须要区分开的,所以如果你用了传统的模型去分析非常复杂的金融市场,那可能就会有很大的偏差。 风险和不确定性是两个概念。再举个例子,ABC三个病人,感染概率分别为95%、30%和50%。 那谁的风险最高呢?病人A。 谁的不确定性最大,病人C,因为我们对他没有信息。 {w:100}

传统机器学习的局限性在于:你用了神经网络,把损失函数最小化,求了最优解,找到了最低点。但金融市场的损失函数可能是以下的第三种,从起点出发优化半天,找不到最低点。所以问题在哪里?问题就在于损失函数形状非常复杂,里面的不确定性导致用传统的模型也没法找到最优解。 {w:100}

我们放松了独立同分布的假设,基于独立不同分布的假设做了很多推导,得到的结论是,传统模型认为95%的概率会发生的事,加一点点刚才说的风险之外的不确定性,置信度就从95%降到了60%了,交易时如果按照95%的信心去交易就会承担很大的风险。所以当我们对不确定性理解更深刻的时候,交易的行为也会相应发生改变。 黑天鹅的厚尾也是一样,厚尾传统是拿Kurtosis第四阶做分析,尾部厚度3就是正态分布。 当市场上不存在分布不确定性的时候,拿到并不是正态分布这样的尾部,一旦存在一点点不确定性,就发现Kurtosis迅速增长,所以它的尾部厚度立刻就增加了许多,之前用的模型就不可以用了。

06

所以我刚才说了半天数学,不是为了去迷惑大家数学很复杂。给大家举个例子,数学到底能做什么? 2020年1月19号我写了一篇公众号《2020想撒欢儿?去做空美股吧》,就两个结论:1、有美股的可以减仓避一避,2、想冒险的可以做空一下。大家都知道2月底美股就发生股灾了,巴菲特也说过:“过去238年有谁靠做空美国赚过钱?”我们团队就笑了,我们确实是在2020年做空美国赚到钱了。 下图黑线是我们的指数,信号就是当它从高点迅速地降下来,超过临界值横虚线的时候,就会有信号发生,从信号发生一直到真正的股灾,就是红线部分。 过去30年里,1987年、2008年、2011、2020年的股灾,都给出了非常准确的信号,如1987年,它在临界线上面迅速穿越之后1月之内就发生了股灾。2011同样的,1月8号超过临界点,于是我们做空购买TVIX指数,从39块钱,在一个月之内到了1000块,实现单个策略回报率25倍左右。同时以0.25美元价格买了看空期权,最终涨到25美元,实现单个策略100倍。

{w:100}

\

07

我们不仅要看结论,也要看结论的逻辑。 股市即便是猴子去做交易也有50%的胜率,如果机构在过去一个月之内胜率很高,也不一定真的表明个人能力强,底层逻辑对。所以我们内部会讨论很多类似问题:你的逻辑到底对不对?停着的钟一天也总有两次时间是对的,所以即便策略是错的从纯概率角度也有可能战胜市场,但如果想要长期战胜市场,底层逻辑必须是对的,而不能是结论暂时正确,这是第一个观点。 第二个观点,我们认为金融市场像海洋的生态,不同的投资者是不同的鱼,但从生态学上看,鲨鱼是不可能吃光所有的小鱼的,没有一种策略能完全收割,但强的鲨鱼可以让弱的鲨鱼没有食物可吃,走向灭亡。所以相同策略的情况下,有可能导致非常卷的竞争局面。 量化的未来到底是什么样的?我们认为现在是量化非常初级的阶段,所有机构都不是鱼,是草履虫,为什么大家觉得策略很卷,很相像,是因为现在处于进化早期,大家都用一样的策略,都吃一样的鱼,于是觉得竞争激烈,行业内卷。到了未来必须是每一家量化机构都像我们超量子基金一样有自己赖以生存的方法论,那各个机构就会变成不同的鱼,形成完整的金融生态,进化的过程中,我们基金想要依赖的是在对金融市场的深刻理解上用数学的方法开发出全新的投研模型。

标签

量化投资
{link}