历史文档

对多因子模型体系的初探及复现

由ypyu创建,最终由ypyu 被浏览 130 用户

导语

本文对华泰证券2016年九月发表的研报《 华泰多因子模型初探》进行了整理与简单的复现,使用的是BigQuant平台上的可视化模板,可供初学者借鉴、熟悉平台的使用以及对因子的理解。 华泰证券-多因子系列之一:华泰多因子模型体系初探.pdf

文章主要有以下内容:

  1. 多因子模型、定量管理、风险、投资组合等偏经济学方面的定义
  2. 多因子模型的构建流程:准备工作,收益模型,风险模型,优化模型
  3. 介绍各种因子,并介绍如何识别因子有效性
  4. 介绍如何回测,检验收益

本文将使用平台的可视化模块复现研报中几类典型因子的截面分布、行业市值中性化后的截面分布以及rank分布

复现的基本方法

策略案例1

首先附上策略的链接: 规模因子(市值对数)的介绍在研报的第16页


https://bigquant.com/experimentshare/45834259d9dd482cac5aad4050a69b9e

提取数据

首先从数据库 估值分析(market_value_CN_STOCK_A)与 财报数据(financial_statement_CN_STOCK_A)分别提取出股票的总市值(market_cap)与净利润(fs_net_income)、营业收入 (TTM)(fs_operating_revenue_ttm)

计算因子数据

使用链接数据模块将两组数据链接在一起,在通过输入特征列表和衍生特征抽取模块,计算出因子数据

提取数据,清理并绘图

对市值因子的分析

现附上对行业市值进行了中性化处理与数据清洗的策略连接:

策略案例2


https://bigquant.com/experimentshare/3270661b80b74511b63bdafa10198369

本节与上个策略不同点在于:1.引入了行业的概念。下图为引入行业的过程 下图为中性化处理的代码:通过groupby函数将行业分组,减去其市值均值,然后在后续作图过程中进行规范化、去极值等操作。 结果如下图:

几类典型因子的截面分布

  1. SP因子(营业收入/总市值) (数据清洗前)

(数据清洗后)

2.EPcut(扣除非经常性损益后净利润/总市值,数据清洗前) (数据清洗后) 3.ROE_TTM (数据清洗前) (数据清洗后)

4.流动比例 (数据清洗前) (数据清洗后) 5.市值对数 (数据清洗前)

(数据清洗后)

标签

多因子模型风险
{link}