每日观点:一键研究全市场所有股票,多因子模型有何神奇之处?
2022-09-20 07:41:39 | 来源:金融界 |
2022-09-20 07:41:39 | 来源:金融界 |
(相关资料图)
(原标题:一键研究全市场所有股票,多因子模型有何神奇之处?)
来源:金融界
作者:灵犀智投团队
一、从主观到量化
传统的股票基本面研究,采用的是分析师阅读公司财报,进行市场调研,在公司进行实地调研,以及邀请行业专家访谈等方式。这样的研究方法耗时费力,而且一次研究仅针对一家或者数家相关的公司。在A股上市公司超过4000家的今天,已经不可能有任何投资者可以凭借这样的方法覆盖全部的上市公司了,甚至对于一个数十人配合有序的投研团队来说,想要覆盖全部的上市公司也是几乎不可能完成的任务。
与股票的主观研究不同,量化研究采用统一的数量化的方法对所有满足特定条件的股票进行研究。在计算机的帮助下,量化研究可以大大提升投研效率,避免研究者的情绪影响。由于量化研究采用的是统一的研究框架,所以不同股票的研究结果之间可比性强。从数量化的角度用统一的模型解释股票的收益率一直是量化投研中的重要问题。
二、从单因子到多因子
最早的对收益率的解释是资本资产定价模型(Capital Asset Pricing Model)。该模型假设了市场是有效的,即股价已经公允地反映了所有公开信息,并且迅速调整到位。每个市场参与者都是理性的。在该模型中预期收益率可以分解为无风险收益率和风险收益率(即风险溢价,对风险的补偿)两部分。该模型认为所有超越无风险收益率的回报都可以用额外承担的风险来解释。同时它也给出了对于股票所承担的市场风险大小的度量。
然而事实上市场并非有效。历史上许多重大事件中股票市场的表现都告诉我们,股价对信息的反应常常是不足的或者过度的,而且常常会经过比较长的时间。并非所有投资者都是理性的,投资者对同样的信息可能有截然不同的判断。与此同时还有一些投资者在依据无效的噪声信息进行交易。
正因为如此,资本资产定价模型对现实中股票市场的解释能力并不强。人们发现了很多股票存在着无法用市场收益率解释的超额收益率。Fama-French三因子模型是资本资产定价模型之后另一个非常著名的模型,该模型认为股票的收益率可以用市场因子、市值因子和账面市值比因子共同解释。该模型比较好地解释了小市值公司和高账面市值比(即低市净率)公司有高于市场的收益率的现象。这实际上是最早的多因子模型。
后续研究中,人们找到了许多对于股票收益率有解释能力而且具有相当普遍性也容量量化的特征,这些指标的来源非常多样,包括公司所在的行业、公司的财务和经营状况、股票的交易状况、以及分析师对公司未来的预期等。人们对这些特征做了精确的定义并做必要的数学处理之后,就得到了因子。
由于股票市场非常复杂,任何单一的因子都无法对股票的收益率做出好的解释,所以人们常常从不同角度构建多种类型的因子,用各个因子收益率的组合来解释股票的收益率。在构建的过程中,一般还会要求选出的因子要有足够强的解释力,与其他因子的关联要尽可能小,同时因子的构成最好比较简单,有比较明确的实际意义,可解释性好。Fama-French三因子模型可以说是最早的比较成功的尝试。
三、多因子模型的典范:barra因子
A股市场上一个常用的因子体系是barra因子。barra因子可以分为三组,分别是国家因子、行业因子和风格因子。其中国家因子和行业因子的暴露比较简单,取值只有1和0,属于该国家和该行业的,对应的国家因子和行业因子的暴露取为1,否则取为0。风格因子从流动性、质量、价值、成长、情绪、动量、市值、波动率、股息率九个一级因子来解释股票的收益率。每个一级因子又由若干个二级因子组成,有些还有更细分的三级因子。Barra风格因子通过良好的定义和恰当的数学处理,既对股票收益率有很强的解释力,同时彼此之间的相关性很低,各个因子也都有比较明确的意义,是一种常用的股票和投资组合的风格分析方法。下面我们对这个常用模型中的风格因子暴露做进一步说明。
3.1 风格因子——流动性
流动性反映股票交易的活跃程度,一般用换手率衡量,只有一个二级因子。barra采用了不同频率的换手率来构建流动性因子。
二级因子 | 相关指标 |
流动性 | 月换手率 |
季换手率 | |
年换手率 | |
指数平均年化换手率 |
3.2 风格因子——质量
质量衡量的是公司财务状况的好坏。衡量财务状况的角度非常多,barra选取了杠杆、盈利稳定性、盈利质量、盈利能力、投资质量这五个二级因子合成为质量因子。
杠杆是公司负债情况的反映。高杠杆的公司在经营状况良好时可以快速扩张,但是在经营状况不佳时亏损甚至破产的风险也更大。
盈利稳定性用各类盈利指标的标准差来度量,一般来说盈利稳定的公司更受投资者青睐。
盈利质量反映的是企业当前的经济现状和未来的经济前景,主要由企业资产和负债状况描述。
盈利能力指的是企业获取利润的能力。
投资质量用企业总资产、股本和资本支出的增长来反映。
二级因子 | 相关指标 |
杠杆 | 股票总市值 |
优先股账面价值 | |
长期负债账面价值 | |
总负债 | |
总资产 | |
所有者权益 | |
盈利稳定性 | 过去5年营业收入标准差 |
过去5年归母净利润标准差 | |
过去5年经营净现金流入标准差 | |
未来12个月每股收益预测标准差 | |
盈利质量 | 货币资金 |
流动资产 | |
应收账款 | |
应付账款 | |
短期负债 | |
存货 | |
折旧摊销 | |
总资产 | |
盈利能力 | 营业收入 |
营业成本 | |
归母净利润 | |
总资产 | |
投资质量 | 总资产5年增长率 |
总股本5年增长率 | |
资本支出5年增长率 |
3.3 风格因子——价值
价值衡量的是股票估值的高低程度,主要用总市值与一些重要财务指标相比来衡量。包含账面市值比、盈利能力和长期反转三个二级因子。
账面市值比即净资产除以总市值,也就是市净率的倒数。
盈利能力考量了企业的利润、现金流以及未来的盈利潜力。
长期反转表示股价过去较长时间内的涨幅,计算中的时长取1040个交易日。衡量标准是长期相对无风险收益的强度和长期相对全市场的强度。
二级因子 | 相关指标 |
账面市值比 | 总市值 |
净资产 | |
盈利能力 | 息税前利润 |
归母净利润 | |
每股收益 | |
折旧与摊销 | |
总市值 | |
长期反转 | 过去1040个交易日涨幅 |
3.4 风格因子——成长
成长衡量企业盈利和营收的历史增长情况,计算中采用过去5年的数据,只有一个二级因子。
二级因子 | 相关指标 |
成长性 | 过去5年每股收益 |
过去5年营业收入 | |
分析师预期长期(3年)净利润增长率 |
3.5 风格因子——动量
动量表示的是过去一段时间股价的涨幅。包括短期反转、季节、行业动量和相对动量四个二级因子。
短期反转衡量短期(计算中取最近一个月)的股价变化。
季节衡量历史同期收益率。
行业动量衡量股票相对其所在行业的强度。
相对动量衡量股票相对全市场的强度。
二级因子 | 相关指标 |
短期反转 | 最近一个月对数日收益率 |
季节 | 过去5年次月收益率 |
行业动量 | 个股相对强度 |
行业相对强度 | |
相对动量 | 过去一年对数收益率 |
历史alpha |
3.6 风格因子——市值
市值衡量股票相对于全市场其他股票的市值,由规模和中市值两个二级因子组成。
规模用流通市值的自然对数表示。
中市值用规模因子的三次方对规模因子正交化取得。
二级因子 | 相关指标 |
规模 | 流通市值 |
中市值 | 规模因子 |
3.7 风格因子——波动率
波动率衡量股价的波动情况,由贝塔和残差波动率两个二级因子组成。
贝塔是过去一年收益率对沪深300指数的回归系数。
残差波动由贝塔的残差波动率,收益率日标准差和累积对数收益率的最值共同决定。
二级因子 | 相关指标 |
贝塔 | 过去一年收益率序列 |
过去一年沪深300指数收益率序列 | |
残差波动 | 回归残差波动 |
日度年化收益率 | |
累计对数收益率范围 |
3.8 风格因子——情绪
情绪衡量分析师对股票的关注度和未来的预期情况。由调整比率、预测EP变化,预测每股收益变化三个二级因子组成。
调整比率衡量分析师的预期调增与调减次数。
预测EP变化衡量分析师对股票EP预测的变化。
预测每股收益变化衡量分析师对股票每股收益预测的变化。
二级因子 | 相关指标 |
调整比率 | 分析师预期调增次数 |
分析师预期调减次数 | |
预测EP变化 | 分析师预测EP |
预测每股收益变化 | 分析师预测每股收益 |
3.9 风格因子——股息率
股息率衡量股票过去和未来预期的派息情况。由历史股息率和分析师预期股息率两个二级因子组成。
历史股息率为过去12个月每股股息除以股价。
分析师预期股息率为分析师预测的未来12个月派息除以股价。
二级因子 | 相关指标 |
历史股息率 | 过去1年股息 |
股价 | |
分析师预期股息率 | 分析师预测未来12个月派息 |
股价 |
四、barra因子收益
在得到国家因子、行业因子和风格因子的暴露之后,我们可以来计算各个因子的收益。对于因子收益,最理想的定义是找到一些股票的组合(每只股票的占比都可正可负),使得组合在该因子上的暴露为1,同时在其他所有因子上的暴露为0。但是考虑到前述对因子暴露的定义,满足这样条件的持仓不一定存在,我们需要做出适当的调整。
与此同时组合还需要有足够的分散度,使得个股的特异性收益对最终结果的贡献可以忽略。
4.1 因子收益——纯国家因子
纯国家因子的组合就是市场组合,即按流通市值的权重持有所有股票。该组合在各个行业上的暴露不为0,取决于该行业的市值。通过恰当的数学处理,可以使得该组合在所有风格因子上的暴露为0。
因子类别 | 因子暴露 |
国家因子 | 1 |
行业因子 | 有正有负 |
风格因子 | 0 |
4.2 因子收益——纯行业因子
纯行业因子的组合是在本行业暴露为1,同时在国家因子暴露为0的组合。因为所有股票在国家因子的暴露都是1,所以该组合多头市值和空头市值相等,并且在其他所有行业因子上的暴露均为负。通过恰当的数学处理,可以使得该组合在所有风格因子上的暴露为0。
因子类别 | 因子暴露 |
国家因子 | 0 |
本行业因子 | 1 |
其他行业因子 | 负 |
风格因子 | 0 |
4.3 因子收益——纯风格因子
纯风格因子的组合应该严格满足前述条件,在国家因子,所有行业因子和所有其他风格因子上的暴露均为0,在自身风格上的暴露为1。因为所有股票在国家因子的暴露都是1,所以该组合多头市值和空头市值相等,仅依靠暴露这一个风格来获取收益。
因子类别 | 因子暴露 |
国家因子 | 0 |
行业因子 | 0 |
本风格因子 | 1 |
其他风格因子 | 0 |
4.4 用因子收益指导投资
上面讨论的纯因子组合大多非常难以实现,但是这不影响其在理论分析中的指导意义。我们可以计算这些纯因子组合的模拟收益率作为因子收益率,对投资形成指导。
例如,我们可以研究各个因子收益率的时序特点,从中找出有稳定收益的因子,有收益但是不稳定的因子,没有收益只有波动的因子等,从而对选股提供有意义的指导。
此外,由于A股市场已经有了超过4000家上市公司。要研究全体股票的相关性,数学上要求价格时间序列的长度不能低于上市公司数量,这在实际中是无法实现的。因子暴露和因子收益率提供了一种非常方便的研究股票相关性的工具,它将我们的分析基础由4000多只股票简化为了数十个因子。解决了相关性分析中的共线性问题,同时也使得结论的可解释性更强。
barra因子是研究行业配置、收益归因,风险暴露等问题的重要工具。“工欲善其事,必先利其器”,要做好量化研究,对于像barra因子这样基础工具的熟练掌握是必由之路。
关键词: 因子模型