华泰人工智能系列之一:人工智能选股框架及经典算法简-华泰证券-20170601
由qxiao创建,最终由qxiao 被浏览 485 用户
摘要
人工智能和机器学习并不神秘
人工智能和机器学习方法并不神秘,其本质是以数理模型为核心工具,结合控制论、认知心理学等其它学科的究成果,最终由计算机系统模拟人类的感知、推理、学习、决策等功能。理解常用的机器学习算法,有助于澄清对人工智能的种种误解和偏见,帮助我们更清晰地认识人工智能的长处和局限,从而更合理、有效地将人工智能运用于投资领域。
机器“学习”的对象是客观存在的规律
机器学习的对象是某种客观存在的规律。这种规律可以非常浅显,比如教给计算机勾股定理,机器就拥有了计算直角三角形边长的智慧。规律也可以相当复杂,如指纹识别系统学习的是不同指纹图像之间差异的规律,苹果语音助手Siri学习的是人类语言的声信号和背后表达意义的规律,无人驾驶学习的是当前路况和驾驶行为的规律。有的规律甚至连人类自己都无法完美诠释,如AlphaGo学习的是围棋落子和胜负之间的规律,智能投顾学习的是资本市场中投资决策和收益之间的规律。
机器学习遵循基本的流程
机器学习往往遵循一些基本的流程,主要步骤包括:数据获取、特征提取、数据转换、模型训练、模型选择和模型预测。数据获取可以通过数据库以及网络爬虫技术,途径日趋多元化。特征提取基于人的经验和探索,优质的特征能够起到事半功倍的效果。数据转换包括缺失值填充,标准化和降维。机器学习模型可分为监督学习,非监督学习和强化学习。模型选择通常借助交互验证和一系列评价指标。
监督学习寻找特征和标签之间的规律,应用极为广泛
监督学习由使用者给出特征和标签,由算法挖掘规律,学习一个模式,并且根据此模式预测新的特征所对应的标签。监督学习应用更广泛,学习效果好。我们从最简单的线性回归模型开始,介绍包括线性回归、岭回归、Lasso回归、逻辑回归、线性判别分析和二次判别分析、支持向量机、决策树、随机森林、AdaBoost、神经网络、深度学习和K最近邻算法在内的众多监督学习方法。
无监督学习通常用来挖掘数据自身的规律
无监督学习不给出标签,由算法仅仅根据原始特征寻找模式,挖掘数据自身蕴含的规律。聚类和降维是常用的无监督学习方法。聚类包括K均值聚类、分层聚类和谱聚类。降维包括以主成分分析为代表的线性降维,以及以流形学习为代表的非线性降维。
风险提示:机器学习的结果是历史经验的总结,存在失效的可能。
正文
/wiki/static/upload/13/13657f53-46ec-4c45-ad60-a7af8921d2a4.pdf
\