研报&论文

华泰人工智能系列之一:人工智能选股框架及经典算法简-华泰证券-20170601

由qxiao创建,最终由qxiao 被浏览 485 用户

摘要

人工智能和机器学习并不神秘

人工智能和机器学习方法并不神秘,其本质是以数理模型为核心工具,结合控制论、认知心理学等其它学科的究成果,最终由计算机系统模拟人类的感知、推理、学习、决策等功能。理解常用的机器学习算法,有助于澄清对人工智能的种种误解和偏见,帮助我们更清晰地认识人工智能的长处和局限,从而更合理、有效地将人工智能运用于投资领域。

机器“学习”的对象是客观存在的规律

机器学习的对象是某种客观存在的规律。这种规律可以非常浅显,比如教给计算机勾股定理,机器就拥有了计算直角三角形边长的智慧。规律也可以相当复杂,如指纹识别系统学习的是不同指纹图像之间差异的规律,苹果语音助手Siri学习的是人类语言的声信号和背后表达意义的规律,无人驾驶学习的是当前路况和驾驶行为的规律。有的规律甚至连人类自己都无法完美诠释,如AlphaGo学习的是围棋落子和胜负之间的规律,智能投顾学习的是资本市场中投资决策和收益之间的规律。

机器学习遵循基本的流程

机器学习往往遵循一些基本的流程,主要步骤包括:数据获取、特征提取、数据转换、模型训练、模型选择和模型预测。数据获取可以通过数据库以及网络爬虫技术,途径日趋多元化。特征提取基于人的经验和探索,优质的特征能够起到事半功倍的效果。数据转换包括缺失值填充,标准化和降维。机器学习模型可分为监督学习,非监督学习和强化学习。模型选择通常借助交互验证和一系列评价指标。

监督学习寻找特征和标签之间的规律,应用极为广泛

监督学习由使用者给出特征和标签,由算法挖掘规律,学习一个模式,并且根据此模式预测新的特征所对应的标签。监督学习应用更广泛,学习效果好。我们从最简单的线性回归模型开始,介绍包括线性回归、岭回归、Lasso回归、逻辑回归、线性判别分析和二次判别分析、支持向量机、决策树、随机森林、AdaBoost、神经网络、深度学习和K最近邻算法在内的众多监督学习方法。

无监督学习通常用来挖掘数据自身的规律

无监督学习不给出标签,由算法仅仅根据原始特征寻找模式,挖掘数据自身蕴含的规律。聚类和降维是常用的无监督学习方法。聚类包括K均值聚类、分层聚类和谱聚类。降维包括以主成分分析为代表的线性降维,以及以流形学习为代表的非线性降维。

风险提示:机器学习的结果是历史经验的总结,存在失效的可能。

正文

/wiki/static/upload/13/13657f53-46ec-4c45-ad60-a7af8921d2a4.pdf

\

标签

人工智能机器学习经典算法

文档

华泰人工智能系列之三十四:再探 AlphaNet,结构和特征优化-华泰证券-20200824华泰人工智能系列之三十四:再探_AlphaNet,结构和特征优化华泰人工智能系列之三十:从关联到逻辑,因果推断初探-华泰证券-20200424华泰人工智能系列之二十九:提升超额收益,另类标签和集成学习-华泰证券-20200319华泰人工智能系列之二十六:遗传规划在CTA信号挖掘中的应用-华泰证券-20191125华泰人工智能系列之十五:人工智能选股之卷积神经网络-华泰证券-20190213 (副本)华泰人工智能系列之二十八:基于量价的人工智能选股体系概览-华泰证券-20200218华泰人工智能系列之二十二:基于CSCV框架的回测过拟合概率-华泰证券-20190617华泰人工智能系列之十五:人工智能选股之卷积神经网络-华泰证券-20190213人工智能系列二十五:真假序列识别再探,市场弱有效性检验与择时战场选择-华泰证券-20191117金工研究:华泰人工智能系列之七-人工智能选股之Python实战-华泰证券-20170912华泰人工智能系列之四:人工智能选股之朴素贝叶斯模型-华泰证券-20170817华泰人工智能系列之三十一: 生成对抗网络GAN初探-华泰证券-20200508华泰人工智能系列之五:人工智能选股之随机森林模型-华泰证券-20170831华泰人工智能系列之二:人工智能选股之广义线性模型-华泰证券-20170622华泰人工智能系列之三十四:再探_AlphaNet,结构和特征优化 (副本)华泰人工智能系列之六:人工智能选股之Boosting模型-华泰证券-20170911华泰人工智能系列三十三:数据模式探索-无监督学习案例-华泰证券-20200702华泰人工智能系列之二十八:基于量价的人工智能选股体系概览-华泰证券-20200218 (副本)华泰人工智能系列之四十一:_基于BERT的分析师研报情感因子华泰人工智能系列之十二:人工智能选股之特征选择-华泰证券-20180725 (副本)华泰人工智能系列之二十九:提升超额收益,另类标签和集成学习-华泰证券-20200319 (副本)华泰人工智能系列之十二:人工智能选股之特征选择-华泰证券-20180725华泰人工智能系列之二十八:基于量价的人工智能选股体系概览-华泰证券-20200218 (副本)华泰人工智能系列之二十七:揭开机器学习模型的“黑箱”-华泰证券-20200206华泰人工智能系列之三:人工智能选股之支持向量机模型-华泰证券-20170804华泰人工智能系列之三十五:WGAN应用于金融时间序列生成-华泰证券-20200828华泰人工智能系列之二:人工智能选股之广义线性模型-华泰证券-20170622 (副本)华泰人工智能系列之二十九:提升超额收益,另类标签和集成学习-华泰证券-20200319 (副本) (副本)
{link}