研报&论文

金工研究:华泰人工智能系列之七-人工智能选股之Python实战-华泰证券-20170912

由qxiao创建,最终由qxiao 被浏览 178 用户

摘要

介绍Python安装方法、与机器学习相关的包以及常用命令

Python语言是目前机器学习领域使用最广泛的编程语言之一,拥有众多优秀的包和模块,并且相对简单易学。我们将简单介绍Python语言的特性,常用命令,以及和机器学习相关的包,例如NumPy,pandas,scikit-learn等,希望帮助有一定编程基础的读者迅速上手Python语言。

机器学习选股框架与多因子选股框架类似,具有一定优越性

机器学习中最为主流的方法监督学习,其核心思想是挖掘自变量和因变量之间的规律。我们将经典多因子模型稍加改造,以机器学习的语言描述。在训练阶段,根据历史的因子值X和收益r,训练监督学习模型r=g(X, f),得到模型自由参数的估计量f。在测试阶段:根据最新的因子值X、参数估计量f和监督学习模型g,预测下期收益r。机器学习方法相较于线性回归的优越之处在于:首先,机器学习可以挖掘数据中的非线性规律;其次,正则化的引入能够筛选出最有效的自变量;再次,参数优化的过程能够遴选出预测力最强的模型。

将机器学习选股代码拆分成十二个子模块进行详尽讲解

我们将机器学习选股代码拆分成十二个子模块,包括:模块导入、参数设置、数据读入、数据标记、数据预处理、模型设置、模型训练、模型预测、模型评价、策略构建、策略评价和结果保存。每个子模块我们将展示代码并且逐句进行讲解。报告中展示的代码是完备且成体系的,可以根据需要进行整合,构建一套完整的机器学习选股模型。风险提示:通过Python编写人工智能选股算法受到数据库架构、网络环境、计算机硬件条件限制,报告中代码经移植后可能不能正常运行;通过人工智能算法构建选股策略是历史经验的总结,存在失效的可能

正文

/wiki/static/upload/1f/1f4792ca-aeba-4832-a1ac-8a8f42ccf0fa.pdf

\

标签

人工智能Python机器学习NumPypandas
{link}