股权分置前后，中国A股市场量化因子有效性白皮书

由qxiao创建，最终由qxiao更新于2023-06-01 14:28 被浏览 159 用户

本报告由清华五道口金融学院与民生财富管理研究中心联合发布《中国A股市场量化因子白皮书》，文章尾后附PDF原文。

摘要

本报告将系统性地研究中国 A 股超额收益的决定性因素，根据 A 股股票交易和财务报表数据构建了 56 个量化因子，分为六大类，分别检验有效性，在 1997年 1 月至 2017 年 12 月期间，共有 13 个有效因子，其中有 9 个属于交易摩擦因子，分别是市值、总波动率、特定波动率、交易额、交易额的波动率、换手率的波动率、最大日收益率、非流动性风险、标准化的换手率；有 2 个属于成长类因子，分别是营业收入增长率，营业收入与存货增长率之差；有 2 个属于盈利类因子，分别是现金净资产比、研发成本。大部分有效因子是受交易流动性驱动。本报告继续探索‘股权分置改革’后的量化因子的有效性，发现结果与全样本结果类似。有 10 个因子有效，其中 6 个属于交易摩擦类因子。

背景介绍

研究背景

近年来，中国的经济迅速发展，已然成为世界第二大经济体，受到世界各国的瞩目。相应的，中国的金融市场也迅速发展，受到国内外投资者的关注。资产定价是金融市场发展的基石，因此，研究中国金融市场上股票收益的影响因素对学者，投资者和监管者具有重要的意义。能够帮助未来学者评估其它量化因子的有效性，评估公募基金和私募基金的风险敞口和能力，衡量股票市场的系统性风险。

现代金融研究认为投资者的收益主要来源于两部分：一部分是来自市场的平均收益（即为 Beta 收益），另一部分是独立于市场的超额收益（即 Alpha 收益）。一般来说，来自市场的收益比较容易获得，而来自于超越市场的 Alpha 收益则非常困难。量化因子的研究实际上就是关于能够带来超额收益 Alpha 的因子的研究。

美国金融市场起步较早，发展较成熟，金融产品种类繁多，因此，美国市场上对量化因子的研究和应用比较广泛和深刻。在业界，大部分机构的股票投资都是基于市场的量化因子来制定交易策略。在学界研究中，近几十年有成百个各种各样的因子出现在文献中。Green， Hand and Zhang (2016) 汇总了美国市场上 94 个公司层面的量化因子，通过 Fama-MacBeth (1973)回归分析，发现 12 个因子可以独立地预测股票收益率。Hou, Xue and Zhang (2017)系统性地研究对比了历史文献中出现的447 个美国市场上的量化因子，发现其中286 个因子是无效的， 93%的流动性因子是无效的。

相比较于美国市场，中国的股票市场起步晚，发展不成熟，产品单一，政府干预较多，以往研究表明中国股票市场和美国市场存在很大的差异。在这种差异下，很多量化因子在美国有效但是在中国未必有效，甚至有些因子在美国和在中国的作用是反向的。Chen, Kim, Yao and Yu (2010) 分别构建了中美市场上 18 个因子并进行了对比，发现在中国市场有效的因子个数远远少于美国。系统性地研究中国股票市场上的量化因子，能够为投资者和监管者提供一定的决策参考。本研究借鉴于美国市场的研究，利用股票分组的方法，深入系统性地探究了中国 A 股市场上的股票量化因子。

多因子模型的理论背景

1952 年，Markowitz 提出现代资产组合理论，引入均值、方差的概念来刻画资产风险收益特征与投资者效用偏好。

自 1964 年，CAPM 模型由 Sharpe (1964),Litner (1965a) and Black (1972) 分别提出，他们认为资产价格的变化由市场风险因子驱动。市场风险与股票的预期收益率是正向的线性关系，并且市场风险外的其它因子不能有效解释股票的预期收益率。

1976 年，Ross 提出 asset pricing theory (APT)模型，认为资产的收益率等于一系列风险溢价的线性相加。APT 对 CAPM 的拓展在于由单因子到多因子，由一般均衡到无套利定价。在多因子模型中，最为有名的是 Fama and French (1992) 三因子模型，模型认为，一个投资组合(包括单个股票)的超额回报率可由它对三个因子的暴露来解释，这三个因子分别是：市场资产组合(Rm−Rf)、市值因子(SMB)、账面市值比因子(HML)。

多因子模型：

	回归方法	已知	未知	学界代表
宏观模型	时间序列回归	因子收益	因子暴露	FF3 因子
基本面模型	横截面回归	因子暴露	因子收益	Fama-MacBeth

本文以后的结构如下：第二部分介绍数据,第三部分介绍因子的构建，第四部分阐述因子有效性的检验，第五部分对因子的相关性做处理，第六部分概述了本文的结论。

数据

本文中所使用的数据主要来源于 Wind 和国泰安数据库。其中，日交易数据来自Wind 数据库，财务报表数据来自国泰安数据库。

日股票交易数据

本文研究对象为中国股票市场上的 A 股股票（包含正在交易和退市的股票）。数据变量包含交易日期，股票代码，每日收盘价，开盘价，最高价，最低价，日收益率，A 股流通股本，A 股总股本，总股本，交易量，交易额，交易换手率等。样本区间是 1995 年 1 月至 2017 年 12 月。其中，收盘价为不复权价格，日收益率包含分红（日收益率数据处理：由于刚上市的公司前几天的涨跌幅较大，投资者不能在新公司上市的前几天买卖交易，所以去除了上市之后的前三个月的股票收益率）。下载的变量对照表见附录 2。

表1 展示了每年中国股票市场上A 股上市交易的公司数目及每年新上市的公司数目。截止到 2017 年底，A 股市场上正在交易的股票数目是 3467 个。中国的 A 股交易于 1989 年开始试点。

表 1：每年 A 股的公司数目

{w:100}{w:100}{w:100}{w:100}{w:100} 1在每月月末，将每只股票的月末收盘价（不复权）乘以 A 股流通股本，得到每只股票的 A 股流通市值。将 A 股市场上所有股票的 A 股流通市值相加，即为市场上所有 A 股的流通市值。图 1 展示了 1995 年初至 2017 年末我国股票市场 A 股总流通市值。

图 1:A 股总流通市值（1995 年-2017 年，单位：兆元）

{w:100}{w:100}{w:100}{w:100}{w:100}

财务报表数据

季度财务报表数据来源于国泰安，数据变量包括总资产、总负债、所有者权益总计、存货、应付股利、每股折旧与摊销、营业收入、利润总额、税收、净利润、营业现金流等。在 2002 或 2003 年以前，财务数据均是半年度数据，即只有 6

月份和 12 月份数据。对于一股票还在交易但是财务数据缺失的情况，我们沿用上一期的数据。关于公司财务数据披露的相关规定为：上市公司的年报在 4 月底前公布，半年报数据在 8 月底前公布，季度数据在次月前公布。

季度财务报表数据下载的路径为：清华大学图书馆-CSMAR 中国上市公司财务报表数据库-财务报表-资产负债表/利润表/现金流量表/所有者权益变动表。下载流程详细见附录 3。

表 2：财务报表数据库汇总

财务报表	表/字段内容	起始日	频率
资产负债表	证券代码、会计期间、报表类型、货币资金、固定资产、流动资产合计、非流动资产合计、流动负债合计、非流动负债合计、股本、归属于母公司所有者权益合计、所有者权益合计、负债与所有者权益总计等字段。	1990	季度
利润表	证券代码、会计期间、报表类型、营业总收入、营业收入、营业总成本、营业成本、营业利润、利润总额、净利润、归属于母公司所有者的净利润等字段。	1990	季度
现金流量表	证券代码、会计期间、报表类型、收到其他与经营活动有关的现金、支付其他与经营活动有关的现金、经营活动产生的现金流量净额、收到其他与投资活动有关的现金、支付其他与投资活动有关的现金、投资活动产生的现金流量净额、收到其他与筹资活动有关的现金、支付其他与筹资活动有关的现金、筹资活动产生的现金流量净额、现金及现金等价物净增加额等字段。	1998	季度
所有者权益变动表	证券代码、会计期间、报表类型、公告来源、科目编码、科目名称、上期期末余额、会计政策变更、综合收益总额、利润分配、期末余额等字段。	2007	季度

因子构建

本研究构建了 56 个量化因子，分为六大类，包括 17 个交易摩擦类因子，5 个动量因子，8 个价值因子，11 个成长因子，8 个盈利因子和 7 个财务流动性因子。

交易摩擦类因子

1.市值（firm size， size） 根据 Banz（1981）计算股票市值，即用每个月月末的（最后一个交易日的）股票收盘价格（不复权价格）乘以每个月月末的 A 股流通股本，也称其为 A 股流通市值。

在每个月的月末(t)，按照月末 A 股流通市值将所有A 股股票等分为 10 组。其中， A 股流通市值最小的 10%的股票在第一组，A 股流通市值最大的 10%的股票在第十组。然后，计算下一个月（t+1）各组流通市值加权的股票组合的月收益率及第十组与第一组收益率之差（即为因子收益率）。以此类推，在每个月月末计算 A 股流通市值并重新分组、计算组合收益率。

2.系统性风险（market beta, beta） 系统性风险的计算来源于著名的 CAPM 模型，它代表了个股受大盘波动影响的系数，具体的计算公式为： {w:100}{w:100}{w:100}{w:100}{w:100} 其中ρi,m代表股票 i 的收益率与大盘指数收益率的相关系数，𝜎𝑖 与𝜎𝑚 则分别代表股票 i 与大盘指数收益率的波动率（即标准差）。大盘指数收益率为 A 股所有股票按流通市值加权构造的股票组合的收益率。我们使用 t-12 月份末到 t 月份末（即过去一年的）的股票和大盘指数的每日收益率计算 t 月份末的系统性风险。计算系统性风险时，要求至少有 120 个日收益率。

在每个月的月末（t），按照上述方法计算出每支股票的系统性风险，并据此将 A股股票等分为 10 组，计算各组合在下一个月（t+1）的市值加权月收益率及第十组和第一组组合收益率之差（即为因子收益率）。以此类推，每个月末根据过去一年的日数据重新计算系统性风险并重新进行股票分组。

3.下行风险 (downside beta，betad)

根据 Ang, Chen, and Xing (2006),下行风险为以低于某一临界收益率为条件而计算得到的系统系风险： {w:100}{w:100}{w:100}{w:100}{w:100} 其中𝑟𝑖 和 𝑟𝑚 分别代表股票和大盘指数的收益率，𝜇𝑚 是大盘收益率的均值。大盘指数收益率为 A 股所有股票以流通市值为权重构造的股票组合的收益率。我们使用 t-12 月份末到 t 月份末（即过去一年）的股票和大盘指数的日收益率计算下行风险。计算下行风险时，要求至少有 120 个日收益率。

在每个月的月末（t），我们使用过去一年的日数据，也就是 t-12 月份末到 t 月份末的日收益率计算下行风险，然后将 A 股所有股票按照下行风险等分为十组，并计算下一个月(t+1)各组流通市值加权的组合收益率。以此类推，每个月末根据过去一年的日数据重新计算下行风险并重新进行股票分组。

4.特定波动率 (idiosyncratic volatility, idvol)

根据 Ang, Hodrick, Xing and Zhang (2006)构建特定波动率（idiosyncratic volatility），将股票收益率对市场大盘指数收益率进行回归，所得残差的标准差即为特定波动率。其回归模型为： \n {w:100}{w:100}{w:100}{w:100}{w:100} 其中𝑟𝑖 和 𝑟𝑚 分别是股票和市场大盘指数的收益率。大盘指数收益率为 A 股所有股票以流通市值为权重构造的股票组合的收益率。将 t-12 月份末到 t 月份末（即过去一年）的股票日收益率对大盘指数日收益率进行回归，得到残差，进而计算残差的标准差，即为 t 月份的特定波动率。计算特定波动率时，要求至少有120 个日收益率数据。

根据 t-12 月份末到 t 月份末的数据计算的特定波动率，在 t 月份的月末将股票等分为十组，然后计算 t+1 月份的市值加权的各股票组合的月收益率。以此类推，在每个月月末重新计算特定波动率并进行重新分组2。

5.总波动率(total volatility, vol) 根据 Ang, Hodrick, Xing and Zhang (2006)，t 月的总波动率为 t-12 月份末到t 月份末（即过去一年）的股票日收益率的标准差。计算总波动率时，要求至少有 120 个日收益率。

6.特定偏态 (idiosyncratic skewness, idskew) 根据 Boyer, Mitton and Vorkink (2009) ，特定偏态的计算过程与与特定波动率基本一致，区别在于计算残差的偏态而非标准差。其回归模型为： {w:100}{w:100}{w:100}{w:100}{w:100} 其中𝑟𝑖 和 𝑟𝑚 分别是股票和市场大盘的收益率。大盘指数收益率为 A 股所有股票以流通市值为权重构造的股票组合的收益率。将 t-12 月份末到 t 月月末（即过去一年）的股票日收益率对大盘指数日收益率进行回归，得到残差，进而计算残差的偏态，即为 t 月份的特定偏态。计算特定偏态时，要求至少有 120 个日收益率数据。

根据 t-12 月份末到 t 月份末的数据计算的特定偏态，在 t 月份的月末进行股票等分为十组，然后计算 t+1 月份各组合流通市值加权的月收益率。以此类推，在每个月的月末重新计算特定偏态并进行重新分组。

7.总偏态 (total skewness, skew12) 根据 Amaya, Christoffersen, Jacobs and Vasquez (2015), t 月的总偏态为t-12 月份末到 t 月份末（即过去一年）的股票日收益率的偏态。计算总偏态时，要求至少有 120 个日收益率。根据t-12 月份末到t 月份末的数据计算的总偏态，在t 月份末将股票等分为十组。计算t+1 月份各组合流通市值加权的的月收益率。我以此类推，在每个月末重新计算总偏态并重新进行股票分组。

8.共同偏态 (coskewness, coskew12) 根据 Harvey and Siddique (2000), 共同偏态为：

{w:100}{w:100}{w:100}{w:100}{w:100} 其中 𝜖𝑖是为股票收益率对市场大盘指数收益率回归的残差。大盘指数收益率为 A 股所有股票以流通市值为权重构造的股票组合的收益率。

使用过去一年的股票日收益率，即 t-12 月份末至 t 月份末的收益率计算 t 月份末的共同偏态。然后在 t 月份末将股票按照共同偏态等分为十组，计算 t+1 月份各组合流通市值加权的月收益率。以此类推，在每个月末重新计算共同偏态并重新进行股票分组。计算共同偏态时，要求至少有 120 个日收益率。

9.交易换手率 (turnover, turn) 根据 Datar, Naik and Radcliffe (1998)， t 月的交易换手率为 t-12 月份末到t 月份末的每日交易换手率的平均值。每日交易换手率可在 Wind 中直接下载得到，其计算方式为每个交易日的交易量除以当日 A 股流通股本。根据 t-12 月份末到 t 月份末的日交易换手率的平均值，在 t 月份末按照平均换手率将股票等分为十组，再计算 t+1 月份的流通市值加权的各股票组合的月收益率。在每个月末重新计算平均交易换手率并重新进行股票分组。计算平均交易换手率时，要求至少有 120 个日观测值。

10.交易换手率的波动率 (volatility of turnover, std_turn) 根据 Chordia, Subrahmanyam and Anshuman （2011），t 月份交易换手率的波动率为 t 月份日换手率的标准差。计算交易换手率的波动率时，要求至少有 10 个日观测值。在 t 月末按照换手率的波动率将股票等分为十组，并计算 t+1 月份的流通市值加权的各股票组合的月收益率。在每个月末重新计算换手率的波动率并进行重新股票分组。

11.交易额 (volume in dollar, volumed) 在 Chordia, Subrahmanyam and Anshuman（2001）中，交易额等于日收盘价乘以当日交易量。据此，定义 t 月份的历史交易额均值为 t-12 月份末到 t 月份末

的日交易额的平均值。日交易额可在 Wind 数据库中直接下载得到。计算交易额的均值时，我们要求至少有 120 个日观测值。计算 t-12 月份末到 t 月份末的日交易额的平均值，然后在 t 月末按照平均交易额将股票等分为十组，再计算 t+1 月份的流通市值加权的各股票组合的月收益率。在每个月末重新计算交易额的均值并重新进行股票分组。

12.交易额的波动率 (volatility of volume in dollar, std_dvol)

根据 Chordia, Subrahmanyam and Anshuman（2001），t 月份交易额的波动率为 t 月份整个月的日交易额的标准差。在 t 月末按照交易额的波动率将股票等分为十组，再计算 t+1 月份的流通市值加权的各股票组合的月收益率。在每个月末重新计算交易额的波动率并重新进行股票分组。计算交易额的波动率时，要求至少有 10 个日观测值。

13.非流动性风险 (illiquidity, illq) 根据 Amihud （2002），首先计算股票的每日非流动性指标，即个股的日收益率绝对值与当日交易额之比，再计算每支股票日非流动性在 t-12 月份末到 t 月份末的平均值，作为 t 月份的非流动性。在 t 月末按照非流动性风险将股票等分为十组，并计算 t+1 月份的流通市值加权的各股票组合的月收益率。在每个月末重新计算换手率的均值并进行股票分组。计算平均非流动性风险时，要求至少有120 个日观测值。

14.标准化的换手率（LM） 根据 Liu（2016），计算标准化的换手率：

{w:100}{w:100}{w:100}{w:100}{w:100} 其中，𝑡𝑢𝑟𝑛𝑜𝑣𝑒𝑟𝑡 为 t 月的日交易换手率之和。NoTD 为 t 月的交易日天数。一个月的 deflator 选为 480,000。日交易换手率等于交易量除以 A 股流通股本，可从 Wind 中直接下载得到。

在每个月计算 LM，然后在 t 月末按照非流动性风险将股票等分为十组，并计算t+1 月份的流通市值加权的各股票组合的月收益率。在每个月末重新计算换手率的均值并进行股票分组。

15.最大日收益率 (maximum daily return, retnmax) 根据 Bali, Cakici and Whitelaw（2011），t 月份的最大日收益率等于在 t 月份整个月中的日收益率中最大的日收益率。按照 t 月份的最大日收益率，在 t 月份末将股票等分为十组，再计算 t+1 月份的流通市值加权的各股票组合的月收益率。在每个月末重新计算下月的最大的日收益率并重新进行股票分组。

16.股本增长率 (changes in shares outstanding, sharechg) 根据 Pontiff and Woodgate（2008），t 月末的股本增长率等于 t 月末的 A 股流通股本除以 t-12 月末的 A 股流通股本并减 1。在 t 月末按照股本增长率将股票等分为十组，再计算 t+1 月份的流通市值加权的各股票组合的月收益率。在每个月末重新计算股本增长率并重新进行股票分组。

17.公司年龄（age） 根据 Jiang, Lee and Zhang (2015），公司年龄为分组日（即 t 月份）与公司上市（IPO）时间之间的年份。

动量因子

18.12 个月动量 (12-month momentum, mom12) 根据 Jagadeesh (1990)，t 月份的 12 个月动量因子等于 t-12 月份末到 t-1 月份末的累计日收益率。在 t 月份末，我们按照此 12 个月的动量因子将股票等分为十组，再计算 t+1 月份的流通市值加权的各股票组合的月收益率。在每个月末重新计算 12 个月的动量因子并进行股票分组。

19.6 个月动量 (6-month momentum, mom6) 根据 Jagadeesh and Titman (1993），t 月份的 6 个月动量因子等于在 t-6 月末到 t-1 月末的累计日收益率。在 t 月份末，按照 6 个月的动量因子将股票等分为10 组，再计算 t+1 月份的流通市值加权的各股票组合的月收益率。每个月末重新计算个月动量因子并进行股票分组。

20.动量变化 (momentum change, momchg) 根据 Gettleman and Marks（2006），t 月份的动量变化等于 t-7 月份末到 t-1月份末的动量减去 t-12 月份末到 t-7 月份末的动量。在 t 月份末，按照动量变化因子将股票等分为十组，再计算 t+1 月份的流通市值加权的各股票组合的月收益率。在每个月末重新计算动量变化因子并进行股票分组。

21.特定动量 (idiosyncratic momentum, imom) 根据 Blitz, Huij and Martens（2011），特定动量是股票收益率中不能被大盘收益率解释的部分的累计和。回归模型为： {w:100}{w:100}{w:100}{w:100}{w:100} 其中，𝑟𝑖 和 𝑟𝑚 分别是股票和市场的收益率。大盘指数收益率为 A 股所有股票以流通市值为权重的组合收益率。将 t-12 月份末到 t-1 月份末的股票日收益率对大盘指数日收益率进行回归，得到残差项 𝜖𝑖,𝑡。残差的累计值即为 t 月份的特定动量。

在 t 月份末，按照特定动量将股票等分为十组，再计算 t+1 月份的流通市值加权的各股票组合的月收益率。在每个月末重新计算特定动量因子并重新进行股票分组。

22.短期反转 (short-term reversal, lagretn) 根据 Jagadeesh and Titman（1993），短期反转即为上个月的月收益率。计算 t月份股票的月收益率，在 t 月末按照此因子将股票等分为十组，再计算 t+1 月份的流通市值加权的各股票组合的月收益率。在每个月末重新计算这个月的月收益率并重新进行股票分组。

在以下几类因子的计算中需要用到公司财务数据，本研究按如下方法对财务类的因子数据进行时间对准3：（1）上一年的 10 月底、11 月底、12 月底以及今年的 1 月底、2 月底和 3 月底使用上一年的第三季度(即 9 月底)的财务报表数据4；（2）今年的 4 月底、5 月底、6 月底以及 7 月底使用上一年度（即 12 月底）的年报数据；（3）今年的 8 月底和 9 月底使用今年的半年报数据（即 6 月底）。另外，对于一些股票还在交易但财务数据缺失的情况，当期数据沿用上一期的数据。

价值类因子

23.公司账面市值比 (book-to-market ratio, BM) 根据 Fama and French (1992), 公司账面市值比等于月末 A 股流通股数除以总股数乘以所有者权益合计除以 A 股流通市值。所有者权益合计来自国泰安的资产负债表，季度更新。 {w:100}{w:100}{w:100}{w:100}{w:100} 使用去年12 月底的所有者权益合计数据和12 月底的股本及市值数据计算公司的账面市值比，此因子用在 4 月份、5 月份、6 月份和 7 月份的股票分组。使用 6 月底的数据构建的因子用在同年 8 月底和 9 月底的股票分组。使用 9 月底的数据构建的因子用在同年 10 月底、11 月底、12 月底以及下一年 1 月底、2 月底和 3 月底的股票分组。

24.总资产市值比 (asset-to-market ratio, AM) 根据 Bhandari（1988），总资产市值比等于总资产合计除以 A 股流通市值。总资产合计来源于国泰安的资产负债表。A 股流通市值等于收盘价（不复权）乘以 A 股流通股本。收盘价和 A 股流通股本来源于 Wind。使用去年 12 月底的总资产合计除以去年 12 月底的 A 股流通市值，计算公司总资产市值比，此因子用在在今年 4 月份、5 月份、6 月份和 7 月份的股票分组中。以此类推，使用今年 6 月底的数据构建的因子，用在今年 8 月底和 9 月底的股票分组。使用今年 9 月底的数据构建的因子用在今年 10 月底、11 月底、12 月底以及下一年 1 月底、2 月底和3 月底的股票分组。

25.总负债市值比 (liabilities-to-market ratio, LEV) 根据 Bhandari（1988），总负债市值比等于总负债除以 A 股流通市值。总负债来源于国泰安的资产负债表。使用去年 12 月底的总负债和 12 月底的市值数据，计算公司负债市值比，此因子用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组。使用今年 6 月底的数据构建的因子用在今年 8 月底和 9 月底的股票分组。使用今年 9 月底的数据构建的因子用在今年 10 月底、11 月底、12 月底以及下一年的 1 月底、2 月底和 3 月底的股票分组。

26.收益价格比 (earnings-to-price ratio, EP) 根据 Basu (1997），收益价格比5等于净利润除以 A 股流通市值。净利润来源于国泰安的利润表。使用去年 12 月底的净利润和 12 月底的 A 股流通市值的数据计算EP，此因子用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组。使用今年 6 月底的数据构建的因子用在今年 8 月底和 9 月底的股票分组。使用今年 9 月底的数据构建的因子用在今年 10 月底、11 月底、12 月底以及下一年的 1 月底、2 月底和 3 月底的股票分组。

27.现金流价格比率 (cash-flow-to-price ratio, CFP) 根据 Lakonishok, Shleifer and Vishny（1994），现金流价格比率等于每股收益 1 加上每股折旧与摊销除以收盘价。如果折旧与摊销为缺失值，则只使用每股收益 1。使用去年 12 月底的每股收益，每股折旧与摊销除和 12 月底的收盘价计算现金流价格比率，此因子用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组。使用今年 6 月底的数据构建的因子用在今年 8 月底和 9 月底的股票分组。使用今年 9 月底的数据构建的因子用在今年 10 月底、11 月底、12 月底以及下一年的 1 月底、2 月底和 3 月底的股票分组。

28.营业现金流价格比率 (operating cash-flow-to-price ratio, OCFP) 根据 Desai, Rajgopal and Venkatachalam（2004），营业现金流价格比率等于 t月份末的营业现金流除以 t 月份末的 A 股流通市值。使用去年 12 月底的营业现金流和 12 月底的 A 股流通市值计算营业现金流价格比率，此因子用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组；使用 6 月底的数据构建的因子用在同年 8 月底和 9 月底的股票分组；使用 9 月底的数据构建的因子用在同年 10 月底、 11 月底、12 月底以及下一年 1 月底、2 月底和 3 月底的股票分组。

29.股利价格比 (dividend-to-price ratio, DP) 根据 Litzenberger and Ramaswamy（1982），股利价格比等于应付股利除以 A 股流通市值。应付股利来源于国泰安的资产负债表。使用去年 12 月底的应付股利和 12 月底的 A 股流通市值的数据计算股利价格比。此因子用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组。使用 6 月底的数据构建的因子，用在同年 8 月底和 9 月底的股票分组。使用 9 月底的数据构建的因子用在同年 10 月底、11 月底、12 月底以及下一年的 1 月底、2 月底和 3 月底的股票分组。

30.营业收入价格比（sales-to-price ratio, SP） 根据 Barbee, Mukherji and Raines（1996），营业收入价格比等于营业收入除以Ａ股流通市值。营业收入来源于国泰安的利润表。使用去年 12 月底的营业收入除以去年 12 月底的 A 股流通市值的数据计算得到营业收入价格比。此因子用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组。使用 6 月底的数据构建的因子用在同年 8 月底和 9 月底的股票分组。使用 9 月底的数据构建的因子用在同年 10 月底、11 月底、12 月底以及下一年的 1 月底、2 月底和 3 月底的股票分组。

成长类因子

31.总资产增长率 (Asset growth ratio, AG)

根据 Cooper, Gulen and Schill（2008）,t 月份的总资产减去 t-12 月份的总资产再除以 t-12 月份的总资产。举例说明，将去年 12 月底的总资产减去前年 12月底的总资产，再除以前年 12 月底的总资产，此增长率分别用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组中。以此类推，用今年月 6 底的总资产减去去年 6 月底的总资产的差，再除以去年 6 月底的总资产，由此得到的增长率分别在今年 8 月份和 9 月份的股票分组中。采用今年 9 月底数据计算的增长率用在今年 10 月底、11 月底、12 月底以及下一年的 1 月底、2 月底和 3 月底的股票分组中。

32.负债增长率 (liabilities growth, LG) 根据 Richardson, Sloan, Soliman and Tunna（2005），总负债增长率等于总负债的年化增长率，也就是 t 月份的总负债减去 t-12 月份的总负债再除以 t-12 月份的总负债。使用 12 月底的总负债减去去年 12 月底的总负债，除以去年 12 月底的总负债，将此因子用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组。使用 6 月底的数据构建的因子，用在同年 8 月底和 9 月底的股票分组。使用 9 月底的数据构建的因子用在同年 10 月、11 月底、12 月底以及下一年的 1 月底、2 月底和 3 月底的股票分组。

33.净资产增长率 (book market value growth, BVEG)

根据 Richardson, Sloan, Soliman and Tunna（2005），净资产增长率等于净资产的年化增长率。净资产等于 A 股流通股数/总股数×所有者权益合计，其年化增长率等于 t 月份的净资产减去 t-12 月份的净资产再除以 t-12 月份的净资产。使用 12 月底的净资产减去去年 12 月底的净资产，除以去年 12 月底的净资产，将此因子用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组。使用 6 月底的数据构建的因子，用在同年 8 月底和 9 月底的股票分组。使用 9 月底的数据构建的因子用在同年 10 月、11 月底、12 月底以及下一年的 1 月底、2 月底和 3 月底的股票分组。

34.存货增长率 (inventory growth, INVG)

根据 Thomas and Zhang（2002），存货净额的增长率6等于 t 月份的净存货额减去 t-12 月份的净存货额，再除以 t-12 月份的净存货额。使用 12 月底的存货净额减去去年 12 月底的存货净额，除以去年 12 月底的存货净额，将此因子用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组。使用 6 月底的数据构建的因子，用在同年 8 月底和 9 月底的股票分组。使用 9 月底的数据构建的因子用在同年 10 月、11 月底、12 月底以及下一年的 1 月底、2 月底和 3 月底的股票分组。

35.存货变化 (inventory change, INVchg) 根据 Thomas and Zhang（2002），存货变化等于存货净额的增长除以平均资产合计。存货净额的增长等于 t 月份的净存货额减去 t-12 月份的净存货额。平均资产合计等于 t-12 月份和 t 月份的总资产平均值。使用 12 月底的存货净额减去去年 12 月底的存货净额，除以 12 月底和去年 12 月底的总资产的平均值，得到存货变化，将此因子用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组。使用6 月底的数据构建的因子，用在同年 8 月底和 9 月底的股票分组。使用 9 月底的数据构建的因子用在同年 10 月、11 月底、12 月底以及下一年的 1 月底、2 月底和 3 月底的股票分组。

36.营业收入增长率 (sales growth, SG)

根据 Lakonishok, Shleifer and Vishny（1994），营业收入增长率等于营业收入的年化增长率，即 t 月份的营业收入减去 t-12 月份的营业收入再除以 t-12 月份的营业收入。使用 12 月底的营业收入减去去年 12 月底的营业收入，除以去年 12 月底的营业收入，得到营业收入增长率，将此因子用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组。使用 6 月底的数据构建的因子，用在同年 8 月底和 9 月底的因子分组。使用 9 月底的数据构建的因子用在同年 10 月底、11 月底、12 月底以及下一年的 1 月底、2 月底和 3 月底的股票分组。

37.营业收入增长率与存货增长率的差(sales growth minus inventory growth, SgINVg)

根据 Abarbanell and Bushee (1998)，营业收入增长率与存货增长率的差等于营业收入增长率减去存货增长率。使用 12 月底的营业收入增长率和存货增长率得到营业收入增长率与存货增长率的差，将此因子用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组。使用 6 月底的数据构建的因子，用在同年 8 月底和 9 月底的因子分组。使用 9 月底的数据构建的因子用在同年 10 月底、11 月底、12月底以及下一年的 1 月底、2 月底和 3 月底的股票分组。

38.营业利润增长率 (profit margin growth, PMG)

根据 Abarbanell and Bushee（1998），t 月份的营业利润增长率等于 t 月份的营业利润收入比减去t-12 月份的营业利润收入比再除以t-12 月份的营业利润收入比。营业利润收入比等于营业利润除以营业收入。使用 12 月底的营业利润除以营业收入减去去年 12 月底的营业利润除以营业收入，除以去年 12 月底的营业利润除以营业收入，将此因子用在 4 月份、5 月份、6 月份和 7 月份的股票分组。使用 6 月底的数据构建的因子，用在同年 8 月底和 9 月底的股票分组。使用 9 月底的数据构建的因子用在同年 10 月底、11 月底、12 月底以及下一年的 1 月底、2 月底和 3 月底的股票分组。

39.税收增长率 (tax growth, TAXchg)

根据 Thomas and Zhang（2011），t 月份的税收增长率等于 t 月份的税收减去 t-12月份的税收再除以 t-12 月份的税收。使用 12 月底的税收减去去年 12 月底的税收的差，除以去年 12 月底的税收，将此因子用在今年 4 月份、5 月份、6 月份和7 月份的股票分组。使用 6 月底的数据构建的因子，用在同年 8 月底和 9 月底的股票分组。我们使用 9 月底的数据构建的因子用在同年 10 月底、11 月底、12月底以及下一年的 1 月底、2 月底和 3 月底的股票分组。

40.增值（Accruals, ACC） 根据 Sloan（1996），增值等于利润总额减去营业现金流，再除以平均资产合计。平均资产合计等于 t-12 月份和 t 月份的总资产平均值。使用去年 12 月底的利润总额减去去年 12 月底的营业现金流，再除以去年 12 月底与前年 12 月底的资产合计的平均值，得到增值，将此因子用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组；使用 6 月底的数据构建的因子，用在同年 8 月底和 9 月底的股票分组；使用 9 月底的数据构建的因子用在同年 10 月底、11 月底、12 月底以及下一年 1 月底、2 月底和 3 月底的股票分组。

41.增值变化（percent Accruals, ACCP）

根据 Hafzalla, Lundholm and Van Winkle(2011)，增值变化等于利润总额减去营业现金流，再除以净利润。使用去年 12 月底的利润总额减去去年 12 月底的营业现金流，再除以去年 12 月底的净利润，将此因子用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组；使用 6 月底的数据构建的因子，用在同年 8 月底和 9 月底的股票分组；使用 9 月底的数据构建的因子用在同年 10 月底、11 月底、12 月底以及下一年 1 月底、2 月底和 3 月底的股票分组。

盈利类因子

42.净资产收益率（return on equity, ROE）

根据 Hou, Xue and Zhang (2015),t 月份的净资产收益率等于 t 月份的净利润除以 t-12 月份的所有者权益合计。使用去年 12 月底的净利润除以前年 12 月底的所有者权益合计，得到净资产收益率，将此因子用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组；使用 6 月底的净利润除以前年 6 月底的所有者权益合计，得到净资产收益率，将此因子用在同年 8 月份和 9 月份的股票分组；使用 9 月底的数据构建的因子用在同年 10 月底、11 月底、12 月底以及下一年 1 月底、2 月底和 3 月底的股票分组。

43.总资产收益率（return on asset, ROA）

根据 Balakrishnan, Bartov and Faurel（2010），t 月份的总资产收益率等于 t 月份的净利润除以 t-12 月份的总资产合计。使用去年 12 月底的净利润除以去年 12 月底的总资产合计，将此因子用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组。使用 6 月底的净利润除以 6 月底的总资产合计，得到总资产收益率，我们将此因子用在同年 8 月份和 9 月份的股票分组。使用 9 月底的数据构建的因子用在同年 10 月底、11 月底、12 月底以及下一年的 1 月底、2 月底和 3 月底的股票分组。

44.利润资产比率（profits-to-assets，PA) 根据 Novy-Marx (2013), t 月份的利润总资产比率等于 t 月份的总利润除以 t 月份的总资产。使用去年 12 月底的总利润除以去年 12 月底的总资产合计，得到利润资产比率，将此因子用在今年 4 月份，5 月份，6 月份和 7 月份的股票分组。使用 6 月底的总利润除以 6 月底的总资产合计，得到利润资产比率，我们将此因子用在同年 8 月份和 9 月份的股票分组。我们使用 9 月底的数据构建的因子用在同年 10 月底、11 月底、12 月底以及下一年的 1 月底、2 月底和 3 月底的股票分组。

45.资本换手率(capital turnover, CT)

根据 Haugen and Baker(1996),资本换手率等于 t 月份的营业收入(t)除以 t-12 月份的总资产合计。使用去年12 月底的营业收入除以前年12 月底的总资产合计，得到资本换手率，将此因子用在同年 4 月份、5 月份、6 月份和 7 月份的股票分组。使用 6 月底的营业收入除以去年 6 月底的总资产合计，得到资本换手率，将此因子用在同年 8 月份和 9 月份的股票分组。使用 9 月底的数据构建的因子用在同年 10 月底、11 月底、12 月底以及下一年的 1 月底、2 月底和 3 月底的股票分组。

46.现金资产比（cash to asset, cash）

根据 Palazzo（2012），t 月份的现金资产比7等于 t 月份的货币资金除以 t-12 月份与 t 月份的平均资产合计。平均资产合计等于 t-12 月份和 t 月份的总资产平均值。使用去年 12 月底的货币资金除以前年 12 月底与去年 12 月底的总资产合计的均值，得到现金资产比，我们将此因子用在 4 月份、5 月份、6 月份和 7 月份的股票分组。使用 6 月底的数据，得到现金资产比，将此因子用在同年 8 月份和 9 月份的股票分组。使用 9 月底的数据构建的因子用在同年 10 月底、11 月底、12 月底以及下一年的 1 月底、2 月底和 3 月底的股票分组。

47.现金生产力(cash productivity, cashpr) 根据 Chandrashekar and Rao（2009），现金生产力为 A 股流通市值加上长期负债再减去总资产合计，最后除以货币资金。使用去年 12 月底的 A 股流通市值加上 12 月份的长期负债再减去 12 月份的总资产合计，最后除以 12 月份的货币资金，得到现金生产力，将此因子用在 4 月份、5 月份、6 月份和 7 月份的股票分组。使用 6 月底的数据计算得到现金生产力，将此因子用在同年 8 月份和 9 月份的股票分组。使用 9 月底的数据构建的因子用在同年 10 月底、11 月底、12 月底以及今年的 1 月底、2 月底和 3 月底的股票分组。

48.研发成本（research and development, RD） 根据 Guo, lev and Shi（2006），研发成本等于管理费用除以 A 股流通市值。中国上市公司的财务报表中没有研发费用，本研究以管理费用来代替。使用去年12 月底的管理费用除以去年 12 月份的 A 股流通市值，得到 R&D，将此因子用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组。使用 6 月底的数据计算得到 R&D，将此因子用在同年 8 月份和 9 月份的股票分组。使用 9 月底的数据构建的因子用在同年 10 月底、11 月底、12 月底以及下一年的 1 月底、2 月底和 3 月底的股票分组。

49.研发成本收入比（R&D to sales, RDsales）

根据 Guo, lev and Shi （2006），研发成本收入比等于管理费用除以营业收入。中国上市公司的财务报表中没有研发费用，本研究以管理费用来代替。使用去年12 月底的管理费用除以去年 12 月份的营业收入，得到 R&D 营业收入比，将此因子用在 4 月份、5 月份、6 月份和 7 月份的股票分组。使用 6 月底的数据构建的因子，用在同年 8 月份和 9 月份的股票分组。使用 9 月底的数据构建的因子用在同年 10 月底、11 月底、12 月底以及下一年 1 月底、2 月底和 3 月底的股票分组。

财务流动性因子

50.流动比率 (current ratio, CR)

根据 Ou and Penman（1989），流动比率等于流动资产合计除以流动负债合计。使用去年 12 月底的流动资产合计除以去年 12 月底的流动负债合计，得到流动比率，将此因子用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组。使用今年6 月底的流动资产合计除以今年 6 月底的流动负债合计，得到流动比率，将此因子用在今年 8 月份和 9 月份的股票分组。使用今年 9 月底的数据构建的因子用在今年 10 月底、11 月底、12 月底以及下一年 1 月底、2 月底和 3 月底的股票分组。

51.速动比率 (quick ratio, QR)

根据 Ou and Penman（1989），速动比率等于流动资产合计减去净存货额，再除以流动负债合计。使用去年 12 月底的流动资产合计减去净存货额，再除以去年12 月底的流动负债合计，得到速动比率，将此因子用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组。使用今年 6 月底的流动资产合计减去净存货额，再除以今年 6 月底的流动负债合计，得到速动比率，将此因子用在今年 8 月份和 9 月份的股票分组。使用 9 月底的数据构建的因子用在今年 10 月底、11 月底、12 月底以及下一年 1 月底、2 月底和 3 月底的股票分组。

52.现金流负债比率（cash flow to debt ratio，CFdebt) 根据 Ou and Penman（1989），现金流负债比率等于净利润除以平均负债合计。t月份平均负债为 t-12 月份和 t 月份的负债合计的平均值。使用去年 12 月底的净利润除以去年 12 月底与前年 12 月底的总负债合计的平均值，得到现金流负债比率，将此因子用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组。使用今年6 月底的数据得到现金流负债比率，将此因子用在今年 8 月份和 9 月份的股票分组。使用今年 9 月底的数据构建的因子用在今年 10 月底、11 月底、12 月底以及下一年 1 月底、2 月底和 3 月底的股票分组。

53.营业收入现金比 (sales to cash ratio, salecash)

根据 Ou and Penman（1989），营业收入现金比等于营业收入除以货币资金。使用去年 12 月底的营业收入除以去年 12 月份的货币资金，得到营业收入现金比，将此因子用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组。使用今年 6 月底的数据得到营业收入现金比，将此因子用在今年 8 月份和 9 月份的股票分组。使用今年 9 月底的数据构建的因子用在今年 10 月底、11 月底、12 月底以及下一年 1 月底、2 月底和 3 月底的股票分组。

54.营业收入存货比 (sales to inventory ratio, saleinv)

根据 Ou and Penman（1989），营业收入存货比等于营业收入除以存货净额。使用去年 12 月底的营业收入除以 12 月份的存货净额，得到营业收入存货比，将此因子用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组。使用今年 6 月底的数据得到营业收入存货比，将此因子用在今年 8 月份和 9 月份的股票分组。使用今年 9 月底的数据构建的因子用在今年 10 月底、11 月底、12 月底以及下一年 1 月底、2 月底和 3 月底的股票分组。

55.流动比率增长率（current ratio growth, CRG）

根据 Ou and Penman（1989），流动比率等于流动资产合计除以流动负债合计，它的年化增长率等于 t 月份的流动比率减去 t-12 月份的流动比率再除以 t-12 月份的流动比率。使用去年 12 月底的流动比率减去前年 12 月底的流动比率，除以前年 12 月底的流动比率，将此因子用在今年 4 月份、5 月份、6 月份和 7 月份的股票分组。使用今年 6 月底的数据得到流动比率增长率，此因子用在今年 8 月份和 9 月份的股票分组。使用今年 9 月底的数据构建的因子用在今年 10 月， 11 月底、12 月底以及下一年 1 月底、2 月底和 3 月底的股票分组。

56.速动比率增长率（quick ratio growth, QRG） 根据 Ou and Penman（1989），速动比率等于流动资产合计减去净存货额的差，再除以流动负债合计，它的年化增长率等月份的速动比率减去 t-12 月份的速动比率再除以 t-12 月份的速动比率。我们使用去年 12 月底的速动比率减去前年12 月底的速动比率，除以前年 12 月底的速动比率，将此因子用在 4 月份、5 月份、6 月份和 7 月份的股票分组。使用今年 6 月底的数据得到流动比率增长率，

此因子用在今年 8 月份和 9 月份的股票分组。使用今年 9 月底的数据构建的因子用在今年 10 月，11 月底、12 月底以及下一年 1 月底、2 月底和 3 月底的股票分组。表 3 展示了 56 个量化因子变量的名称，也就是简称，这些变量的中文和英文的全称。这些因子的文献出处及在美国市场上的构建详见附录 1。

表 3：量化因子列表

{w:100}{w:100}{w:100}{w:100}{w:100}

因子有效性检验

因子有效性检验方法

本研究采用非参数分析，即排序法或筛选法将股票按照其各个因子的大小进行排序，将股票等分为 10 组，因子最小的股票在第一组，因子最大的股票在第十组，计算下期各组的市值加权的收益，并计算第十组与第一组的股票收益率之差，即

为因子收益。本研究关注因子收益的以下指标：（1）年化加权收益率（2）t 检验（3）Newey West (1987） t 检验8 （4）累计收益率（5）年化波动率（6）夏普比率9 （7）最大回撤

描述统计

我们按照第三节的描述构建 56 个量化因子。表 4 展示了每个月末各因子的描述统计值，包括各个变量的均值，标准差，最小值，25%分位数，中位数，75%分位数，最大值。样本区间为 1997 年 1 月到 2017 年 12 月。

表 4：因子的描述统计（1997.01-2017.12）

{w:100}{w:100}{w:100}{w:100}{w:100} 其中：计算所用的交易额的单位为百万元，市值的单位为十亿元。LM 的单位为百万。总波动率，特定波动率，股本增长率，最大日收益率，动量变化，短期反转，收益价格比，现金流价格比，营业现金流价格比，股利价格比，存货变化，增值，总资产收益率，研发成本的单位是%。公司年龄是年。注，有些因子出现较大月收益率，可能可能是因为部分公司上市后又进行调整，重新上市，重新上市的收益率很高。

每个月末分组（1997 年开始）

在每个月的月末，将所有 A 股股票按因子从小到大排列，等分为 10 组，其中 10% 因子最小的股票在第一组，10%因子最大的股票在第十组。随后，计算下个月每组股票 A 股流通市值加权的组合收益率，并计算第十组与第一组收益率之差，即为市场因子收益。以此类推，按照此步骤进行下一个分组。最后，得到在样本区间内每组的收益率及第十组与第一组收益率之差。本研究重点关注第十组与第一组的收益率之差（也称作因子收益）的均值，t 检验，Newey-West t 检验，累计收益率，年化波动率，夏普比率，及最大回撤。由于前期股票数量少，财务报表缺失数据严重，再加上中国 1996 年底推出 10%涨跌幅限制，所以分组始于 1997年 1 月份。

{w:100}{w:100}{w:100}{w:100}{w:100}

各个股票因子的构建

表 5 展示了将所有 A 股股票按照因子等分为 10 组后，因子最大组（第十组）与最小组（第一组）的收益率之差的统计分析结果，包括年化收益率，t 检验, Newey-West t 检验，年化波动率，夏普比率，最大回撤。样本区间是 1997 年 1 月至 2017 年 12 月。在构建的 56 个因子中共有 13 个有效因子，其中有 9 个属于交易摩擦因子，分别是市值、总波动率、特定波动率、交易额、交易额的波动率、换手率的波动率、最大日收益率、非流动性风险、标准化的换手率；有 2 个属于成长类因子，分别是营业收入增长率，营业收入与存货增长率之差；有 2 个属于盈利类因子，分别是现金净资产比、研发成本。大部分有效因子是受交易流动性驱动。

{w:100}{w:100}{w:100}{w:100}{w:100} 以市值因子为例，第十组与第一组的收益率的差的平均值为负数，表明小市值股票的收益高于大市值的股票，因此看多小市值股票（第一组），看空大市值股票（第十组），每个月的资产组合的 H-L 收益等于第一组的收益减去第十组的收益，在样本区间内计算组合的净值。

图 2：H-L 组合净值图（1997.01-2017.12） A.市场交易摩擦类因子（17）

{w:100}{w:100}{w:100}{w:100}{w:100}

B.动量类因子（5）

{w:100}{w:100}{w:100}{w:100}{w:100}

C.价值因子（8）

{w:100}{w:100}{w:100}{w:100}{w:100}

D. 成长因子（11）

{w:100}{w:100}{w:100}{w:100}{w:100}

E.盈利因子（8）

{w:100}{w:100}{w:100}{w:100}{w:100}

F.财务流动性因子（7）

{w:100}{w:100}{w:100}{w:100}{w:100}

每个月末分组（2007 年股改之后）

中央政府于 2005 年开始推动“股权分置改革”（以下简称为“股改”）。截止到 2006 年底，沪深两市有 80%以上的上市公司已完成股权分置改革。截止到 2007 年 12 月 31 日，沪深两市共 1298 家上市公司已完成或进入股改程序的上市公司市值占应改革上市公司总市值的比重达到 98%，股权分置改革基本完成。本研究将分析股改完成之后近 10 年中国市场上因子的表现情况。2007 年的 1 月份为第一次分组。

在每个月的月末，将所有 A 股股票按因子从小到大排列，等分为 10 组，其中 10% 因子最小的股票在第一组，10%因子最大的股票在第十组。随后，计算下个月每组股票流通市值加权的组合收益率，并计算第十组与第一组收益率之差，即为市场因子。以此类推，按照此步骤进行下一个分组。最后，得到在样本区间内每组股票的收益率及第十组与第一组收益率之差。本研究重点关注第十组与第一组的收益率之差的均值，t 检验，Newey-West t 检验，累计收益率，年化波动率，夏普比率，及最大回撤。

表 6 展示了将所有 A 股股票按照因子等分为 10 组后，因子最大组（第十组）与最小组（第一组）的收益率之差的统计分析结果，包括年化收益率，t 检验, Newey-West t 检验，年化波动率，夏普比率，最大回撤。样本区间是 2007 年 1 月至 2017 年 12 月。在构建的 56 个因子中共有 10 个有效因子，其中有 6 个属于交易摩擦因子，分别是市值、交易额、交易额的波动率、换手率的波动率、非流动性风险、标准化的换手率；有 2 个动量因子，分别是动量变化、短期反转；有 1 个属于盈利类因子，是现金净资产比；有 1 个属于财务流动性因子，是速动比率增长率。大部分有效因子是受交易流动性驱动。

表 6：因子分组（第十组与第一组收益率差）的汇总分析（2007.01-2017.12）

{w:100}{w:100}{w:100}{w:100}{w:100}

图 3 展示了看多高收益的股票组合、看空低收益的股票组合（H-L）的的净值图。以市值因子为例，第十组与第一组的收益率的差的平均值为负数，表明小市值股票的收益高于大市值的股票，因此看多小市值股票（第一组），看空大市值股票（第十组），每个月的资产组合（H-L）的收益等于第一组的收益减去第十组的收益，在样本区间（2007.01-2017.12）内计算组合的净值。

图 3：H-L 组合收益净值图 (2007.01-2017.12) A.市场交易摩擦类因子（17）

{w:100}{w:100}{w:100}{w:100}{w:100}

B.动量因子（5）

{w:100}{w:100}{w:100}{w:100}{w:100}

C.价值因子（8）

{w:100}{w:100}{w:100}{w:100}{w:100}

D.成长因子（11）

{w:100}{w:100}{w:100}{w:100}{w:100}

E.盈利因子（8）

{w:100}{w:100}{w:100}{w:100}{w:100}

F.财务流动性因子（7）

{w:100}{w:100}{w:100}{w:100}{w:100}

因子相关性处理

由于因子的个数较多，有些因子的构建存在相似性，必然存在一些相关性较高的因子。在进行多因子组合共同选择股票时，因子间的高度相关性会增加这一类因子的权重，从而导致某一类的风险增大。因子间的相关性可以从横截面以及时间序列两个角度来理解。下面列举一对在横截面相关性较高的因子：市值和交易额。一般情况下，市值大的公司交易额也高。所以二者存在正的相关性。

图 4 列举了四组横截面相关性较高的因子，分别是市值因子与交易额，市值与交易额波动率，交易额与交易额的波动率，交易额波动率与换手率波动率。在每个时间点，利用横截面数据来计算两个因子间的相关性。如图所示，市值因子与交易额因子有很强的正相关性，特别是在样本期的前几年。

图 4 因子截面相关性分析（1997.01-2017.12） A.市值与交易额因子的截面相关性（1997-2017）

{w:100}{w:100}{w:100}{w:100}{w:100}

B.市值与交易额波动率因子的截面相关性（1997-2017）

{w:100}{w:100}{w:100}{w:100}{w:100}

C.交易额与交易额的波动率因子的截面相关性（1997-2017）

{w:100}{w:100}{w:100}{w:100}{w:100}

D.换手率的波动率与交易额的波动率的截面相关性（1997-2017）

{w:100}{w:100}{w:100}{w:100}{w:100}

如上图所示在有效的因子里，有些因子的相关性很高。在券商报告中，有一些处理因子相关性的方法，如因子正交方法：

选择某一因子 i 为初始选股因子，其正交因子值等于原始因子值；
对于某一因子 j,其正交值可通过横面回归取残差的方式获得，即以其原始因子为自变量，现有的正交因子值为因变量进行多元回归，取回归残差为该因子的正交
将改因子加入现有的正交因子集合中去。经验证，此方法的缺点是因子引入的顺序不同，结果差别很大。

在本报告中，将采取同类因子相关性高剔除法。每一类因子中，如果两个因子的相关性很高，一般大于 0.2，只选取其中比较常用的一个因子。例如，市值和交易额的相关性很高（大于 0.4），使用多因子进行选择股票组合时，要剔除交易额。表 7 展示了在 1997-2017，2007-2017 样本区间内有效因子的相关性矩阵。可以发现在 1997-2107 区间内，有 11 组因子的相关性超过 0.2。其中相关性最高的是总波动率与特定波动率（0.97），其次是交易额与交易额的波动率（0.64），次之是最大日收益率与换手率的波动率（0.48）。市值与交易额和交易额的波动率的相关性都很高，可以剔除交易额和交易额的波动率，最大日收益率与总波动率，换手率的波动率相关性很高，可以剔除最大日收益率因子，总波动率与特定波动率，可以剔除特定波动率。那么，相关性处理后，有 9 个有效因子。

在 2007-2107 区间内，有 4 组因子的相关性超过 0.2。其中相关性最高的是交易额与交易额的波动率（0.55），次之是市值与交易额（0.35）。市值与交易额和交易额的波动率的相关性都超过 0.28，可以同时剔除交易额与交易额的波动率。这样，相关性处理后，有 8 个有效因子。

表 7：有效因子相关性矩阵

{w:100}{w:100}{w:100}{w:100}{w:100}

表 8: 有效因子的汇总

{w:100}{w:100}{w:100}{w:100}{w:100}

结论

本研究基于交易和财务数据，结合中国的制度，依据已发表的历史文献复制了56 个量化因子，利用分组法逐个检验因子的收益，也就是检验因子否产生超额（异质性的）收益。检验的样本分为两个，第一个是全样本，1997-2017，第二个是股改之后，2007-2017，其研究结果如下。

在 1997 年 1 月至 2017 年 12 月期间，因子有效性检验结果表明 56 个因子中共有13 个因子是有效的，其中有 9 个属于交易摩擦因子，分别是市值、总波动率、特定波动率、交易额、交易额的波动率、换手率的波动率、标准化的换手率、非流动性风险、最大日收益率；有 2 个属于成长类因子，分别是营业收入增长率，营业收入与存货增长率之差；有 2 个属于盈利类因子，分别是现金净资产比、研发成本。大部分有效因子是受交易流动性驱动。

在“股权分置改革”之后，即 2007 年 1 月至 2017 年 12 月期间，56 个因子中共有 10 个有效因子，其中有 6 个属于交易摩擦因子，分别是市值、交易额、交易额的波动率、换手率的波动率、非流动性、标准化的换手率；有 2 个动量因子，分别是动量变化、短期反转；有 1 个属于盈利类因子，是现金净资产比；有 1 个属于财务流动性因子，是速动比率增长率。大部分有效因子是受交易流动性驱动。

/wiki/static/upload/62/629577e6-8f98-4bda-b835-411073112284.pdf

股权分置前后，中国A股市场量化因子有效性白皮书

摘要

背景介绍

研究背景

多因子模型的理论背景

数据

日股票交易数据

财务报表数据

因子构建

交易摩擦类因子

动量因子

价值类因子

成长类因子

盈利类因子

财务流动性因子

因子有效性检验

因子有效性检验方法

描述统计

每个月末分组 （1997 年开始）

每个月末分组 （2007 年股改之后）

因子相关性处理

结论

标签

每个月末分组（1997 年开始）

每个月末分组（2007 年股改之后）