幻方徐进:如何用Deep Learning为股票定价
由crisvalentine创建,最终由crisvalentine 被浏览 132 用户
演讲概述
2021世界人工智能大会于2021年7月8日至10日在上海世博中心和上海世博展览馆同时举行。世界人工智能大会自2018年以来,已成功举办三届。2021世界人工智能大会由国家发展和改革委员会、工业和信息化部、科学技术部、国家互联网信息办公室、中国科学院、中国工程院、中国科学技术协会,以及上海市人民政府共同主办。
作为本届世界人工智能大会承办单位之一,数库科技于7月9日下午举办以 “数据智能,链接未来” 主题分论坛,会中幻方量化合伙人徐进探讨了如何使用量化模型和深度学习在股市中赚钱的路径。
图片来自数库科技
徐进提到,与传统股票定价不同,量化通过输入获取的信息,包括行情数据、上市公司财务数据,还有另类数据,比如新闻舆情、产业链等,进行模型训练,利用深度学习对股票进行定价。
在徐进看来,在这个过程中,需要处理很多关键细节,**细节是魔鬼!**以时间序列预测模型为例,包括数据清洗、规划处理、防止过拟合、 避免未来函数等,大量的细节决定了量化能否赚钱,并不是简简单单就能成功的。“只要你对市场、数据充分了解之后,才能得出比较好的赚很多钱的结果。”徐进说道。
徐进提到,量化通过训练模型、提升算力、提高集群使用效率等,来提升其深度学习能力,一定程度上在“薅”市场羊毛。但从另一个角度来看,量化对市场的正面影响很大。一是为市场提供流动性,平抑市场波动,二是提升市场的有效性,让公司定价更为合理。三是和全球顶尖的对冲基金进行竞争,提高本国的金融交易竞争力。
量化投资与机器学习公众号作为本次论坛的支持媒体单位,全程参与论坛的报道工作。下面,是公众号对徐进先生在本次论坛演讲内容的整理:
如何用Deep Learning为股票定价
这个模型所需的数据都是公开的,需要的算力也不是很大,一两块游戏卡就能搞定。当然它不会支撑特别大的资金量。
首先这个模型的输入是全市场股票的数据价格,这个模型只用到了价格(当日的开高低收+均价)。
中间的图片是一个最简单的时间序列的预测模型——LSTM。如果你真的用心拿这个模型去做,最后你也是能赚钱的。但是,赚钱也还是前提的:细节是魔鬼!就是说上面这些你都做了,但是你还是要处理很关键的细节,而这些细节其实才是最终你能赚多少钱的一个核心问题。
拿数据清洗来说,为什么要对数据进行清洗?
上面的数据看上去也不是很复杂,也就是高开低收以及当日成交均价,但是这里面会隐藏很多问题,比如有些股票是刚上市的新股等。再者是涨停、跌停的股票怎么处理。有些股票波动异常,甚至被证监会点名有操纵的嫌疑,这些该怎么处理?对于金融时序数据来说,噪音非常大,信噪比非常低。我们如果预先对一些数据进行处理,这对你的模型训练会有很大的帮助。如果你什么都不管,把数据直接丢给LSTM模型,基本上得不到好的结果,因为LSTM也不是神!
类似于这样的细节后面还有很多,只要你对市场、数据充分了解之后,才能得出较好的、赚更多钱的结果。