量化思维在A股中的运用
由iquant创建,最终由iquant 被浏览 233 用户
日前,在“AI+金融 数造未来”X-BigQuant1.0系统发布会上,君道量化执行董事林明轩发表了《量化思维在A股中的运用》的演讲,内容如下:
策略构建思路
还原投资这件事情的流程,就是获取信息——信息处理——构建策略。
就像我们晚上出去开车,首先把车灯打开,然后看一看有没有红绿灯、行人、斑马线,这个是获取信息。
看到信息以后,人就会处理信息处理,红灯停,绿灯行,正确的信息处理才能产生对的策略。
不管量化投资还是主观投资,大流程都是这样。策略是其中最简单、也是最不重要的事情,因为只要信息获取的是有效的、真实的,我们正确处理了这些信息,构建出来的模型都是有效的,只是赚多赚少的问题。
再来想一想,为什么要半夜出来开车,目的是什么?然后再反问自己,炒股可能亏钱可能赢钱,为什么还要炒股?我们是要当飙车大赛第一名,还是出来挣外快。如果是挣外快,那就高高兴兴出门、平平安安回家,不做出太大的事故就把钱赚了,在我看来,炒股最终的目的应该就是在利润和风险之间做妥协、做平衡,相对安全地获得收益。
关于信息获取 昨日涨停VS昨日曾涨停
怎样获得有效信息?大家常常听到亏损股、绩优股、价值投资这些概念,我们先不去评价好坏,量化比较好的一点就是可以先不去主观地评价某一些东西,而是先看看客观是长什么样子。
拿亏损股和绩优股来说,绩优股可能长期比较容易获得收益,但是亏损股爆发力更为明显。这两者之间没有对错,主要看我们交易思路到底是什么,是择时还是时间的玫瑰。
也很多朋友问:“你们做量化私募,是不是打板?”
我的回答是:我们没有能力去做这个事儿。为什么没有能力?给大家看两组数据:昨日涨停和昨日曾涨停。
指数型上升的是昨日涨停的指数,非常漂亮,大家都觉得可以盈利很多,但是涨停板里面含有未来函数。
什么是未来函数?就是不确定性,今天早上10点涨停的股票不一定能坚持到下午15点,他接下来有两种走势:继续涨停或者下跌。如果我们有能力辨别今天10点的股票在15点能不能继续封住涨停,就会得到第一条曲线,但是我们没有能力做这件事,我们有大概率会得到“曾涨停”。
上证50、沪深300、中证500
一个最基础的问题,上证50、沪深300、中证500,这三个大家最熟悉的指数,它们的成分股之间是什么关系?
沪深300万全包含上证50,并且靠近头部;中证500和沪深300正好不相交,是剔除了沪深300以后最好的500支股票。
这个逻辑看着很简单,但除了包含关系和交集关系还有什么问题:权重最大的成分股是哪只?前三大权重股占( 50/300/500 )多少的权重?50中成分股占300的权重比例是多少?50中的行业分布是什么样的?50与500的成分进出表现?龙头个股和指数的相关性是什么样的?指数成分是可变的,平均每三年的话,这些指数的成分有多大的变化?这些都是非常有意思的事情。
第一权重股是哪支,大家肯定心里都有谱——贵州茅台。但是2020年5月的时候,第一权重股不是贵州茅台而是中国平安,在上证50里面权重占15.8%,沪深300占6.1%。
“茅招平”,茅台、平安、招商银行三只对大盘影响最深的成分股,分别在上证50里面占权重32%,沪深300占比12.5%,与大家直觉并不完全相同,所以说研究“茅招平”的话,做IF和IH套利肯定是有帮助的。
上证50中的行业分布又是什么样的呢?2021年7月最新数据显示:食品饮料占比22%;银行占比18%;其次为非银金融及医药。对比2015年的上证50,第一大权重行业银行占比34%,非银金融占比30%;食品饮料在2015年的时候只有4.4%。市场确实是变化的,如果量化投资人仍然采用2015年的模型,标的虽然都是上证50,但是已经发生了质的变化。
我们再从动态角度看看上证50的模型构造,一般来说换成份都是从尾部标的开始替换,比如把40多位的成分股换出去,再把指数外的标的换进来。
那么上证50,每隔三年留下的权重及股票百分比分别是多少多少?——78%、39%。
每隔三年还有78%的权重在指数内可能还在预期范围内,但是留下股票的数量百分比仅为39.3%,所以“茅招平”排位可能会发生变化,但一直在前面,而上证50后部的标的其实发生了翻天覆地的变化。
那再来看一看中证500。三年的话,变化有多少呢?留下的权重百分数只有39%。
对比上证50和中证500,从成分构成到动态的结构来说都是不一样的,中证头部、尾部的都在进进出出,所以数量和权重变化基本同步。所以上证50和中证500逻辑完全不一样,最好也不要用一把钥匙去尝试开两把锁。
我们再来看看上证50的成分股和指数的相关性,看能不能找到领头羊?带着羊群走。
深色是完全正相关的,相关性越低颜色越浅甚至有负相关的。在这里面中国平安0.91非常高,其次是招行0.81、兴业银行0.78、中信证券0.86、民生银行0.79,大金融板块与大盘紧密相连。
茅台-0.02,就意味着它是一直很大的羊,但是不带着羊群走,这是茅台的特性,如果用茅台去预测市场的话,大概率很难。
标准数据VS非标数据
信息是客观存在的,但是每个人因为阅历不同、思维模式不同,信息处理方式各种各样,不能简单地划分对错。
数据一般分成两种,第一种就是标准化数据,第二种是非标准化数据。
第一个标准数据,比如在股票里面4000支上涨的股票,很快就能选出来,因为这些是明确的,普通20秒出结果,可能如果用款BigQuant可能3秒就出结果。10倍,但是大家感觉不到差异,但如果算法复杂需要30个小时,这个时候就体现出算法、算力的速度优势。
一般做量化都不怎么追求速度,因为没必要熬5个通宵去把18秒变成5秒。然而做 AI的数据的话,把30个小时变成3个小时,就需要宽邦这样的平台。
第二个非标准化数据,量化最难就是政策解读,一般这类文章比较委婉,不同的人解读也都不一样。做量化交易的如果自己都读不明白怎么去写策略。
哪怕全部处理对了,非标数据处理成标准信息后,也会损失掉非常多的信息,只能处理为积极&消极词频。
拥抱时代,享受交易
未来交易展望:
1、大家都是在信息不完整的过程中进行博弈。
2、八仙过海,各显神通,这个市场足够大,有足够的包容性,可以包容各种各样的交易方式,主观、量化、甚至八卦。
3、市场是变化的、动态的,就要用变化的策略、动态的策略去应对市场。
4、策略是在盈利和风险上取一个平衡,如同一对孪生兄弟。
5、如何获取、处理海量的信息,就像做饭一样,尽量拿到品种比较多的食材才有可能性做出好吃的饭。
6、量化分全自动或者半自动,你可以自动驾驶,也可以尝试驾驶辅助系统。
希望大家拥抱时代,享受交易。谢谢大家,今天演讲到此为止。