其他分享
首页 > 其他分享> > 量化经典问题——多因子选股模型

量化经典问题——多因子选股模型

作者:互联网

原文链接:https://dwz.cn/858B9QRm

一、什么是多因子模型?

寻找那些对股票收益率最相关的影响因素,使用这些因素(因子或指标)来刻画股票收益并进行选股。

核心思想在于,市场影响因素是多重的并且是动态的,但是总会有一些因子在一定的时期内能发挥稳定的作用。

二、理论背景

证券组合超额收益=alpha + beta*市场组合超额收益

马科维茨论文:开创性地引入了均值和方差来定量刻画股票投资的收益和风险(被认为是量化交易策略的鼻祖),建立了确定最佳资产组合的基本模型。

CAPM:CAPM模型认为所有证券的收益率都与唯一的公共因子(市场证券组合)的收益率存在着线性关系

APT:针对CAPM模型存在不可检验性的缺陷,套利定价理论以收益率形成过程的多因子模型为基础,认为证券收益率与一组因子线性相关,这组因子代表证券收益率的一些基本因素。事实上,当收益率通过单一因子(市场组合)形成时,将会发现套利定价理论形成了一种与资本资产定价模型相同的关系。因此,套利定价理论其实是一种广义的资本资产定价模型,该理论成了多因子量化选股模型的重要理论基础。

FF三因子:套利定价理论并没有指出影响证券收益的具体因素,在应用中需要预先判断哪些因素可能影响证券收益,并使用统计分析方法进行验证。1992年,Fama和French对美国股票市场决定不同股票回报率差异的因素的研究发现,股票的市场的beta值不能解释不同股票回报率的差异,而上市公司的市值、账面市值比、市盈率可以解释股票回报率的差异,因此提出了著名的三因子模型。

FF+MOM:随着市场交易实践和研究的不断深入,研究者又发现市场中的动量现象无法用三因子模型解释。

五因子:从直觉上理解,在其他条件一定的情况下,财务质量高的上市公司应该带来更高的投资回报,因此有必要引入刻画公司资产质量的因子。2013年,Fama的学生阿斯内斯 (Asness)对公司“质量”进行量化,并提出了五因子模型。

六因子:低波动率(低beta)股票组合的实际收益比高波动率(高beta)股票组合的要高,引入波动率因子。 

 

 

三、如何构建

原理:认为股票收益率是由一系列因素(因子)决定的,根据经济金融理论或市场经验寻找这些因子,然后通过对历史数据的拟合和统计分析进行验证和筛选,最后以这些因子的组合作为选股标准,买入满足这些因子的股票。

五个步骤:因子选取、因子有效性检验、因子筛选、综合评分模型以及模型的评价和改进。l 因子选择:一共有如下几类因子

(1)市场整体:市场因子、系统性风险等;

(2)估值因子:市盈率、市净率、市销率、 市现率、 企业价值倍数、 PEG 等;

(3)成长因子:营业收入增长率、营业利润增长率、净利润增长率、每股收益增长率、净资产增长率、股东权益增长率、经营活动产生的现金流量金额增长率等;

(4)盈利能力因子:销售净利率、毛利率、净资产收益率、资产收益率、营业费用比例、财务费用比例、息税前利润与营业总收入比等; 

(5)动量反转因子:前期涨跌幅等; 

(6)交投因子:前期换手率、量比等; 

(7)规模因子:流通市值、总市值、自由流通市值、流通股本、总股本等; 

(8)股价波动因子:前期股价振幅、日收益率标准差等;

(9)分析师预测因子:预测净利润增长率、预测主营业务增长率、盈利预测调整等。 

l 因子有效性检验:

这部分待更深入学习了解。

a. 看barra文档!

b. 了解IC/IR指标判定因子有效性:IC就是因子与下一期股票收益率的相关系数,现在一般也用RANK_IC,就是因子排名与下一期股票收益率的相关系数。IR一般来讲是IC序列的均值/IC序列的标准差。

c. 正交化法:经过了单因子检验的因子,很多时候往往具有共线性,也就是说往往是一类因子,这时候可以选择把同类因子按照一定的权重进行合成,或者也可以选择不断进行正交化,把残差作为新的alpha因子。在正交化的过程中,如果出现系数不显著的情况,说明这个新增的因子并没有给整个模型带来新增的alpha,那么就可以考虑把这个因子删除。

l 因子有效性检验:

不同的选股因子可能由于内在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除, 而只保留同类因子中收益最好,区分度最高的一个因子。

例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。

假设需要选出 K 个有效因子,样本期共 M 月:

(1)先对不同因子下的 N 个组合进行打分,分值与该组合在整个模型形成期的收益相关,收益越大,分值越高; 

(2)按月计算个股的不同因子得分间的相关性矩阵; 

(3)在计算完每月因子得分相关性矩阵后,计算整个样本期内相关性矩阵的平均值;

(4)设定一个得分相关性阀值,将得分相关性平均值矩阵中大于该阀值的元素所对应的因子只保留与其他因子相关性较小、有效性更强的因子,而其它因子则作为冗余因子剔除。

l 综合评分模型:回归法(OLS)和打分法

回归法:估计出回归方程系数,将最新的因子带入回归方程估计股票未来收益,以此为依据进行选股。问题是很难找到一个精确拟合的回归方程,模型误差比较大。

打分法:根据一定的权重加权得到一个总分,根据总分对股票进行筛选。排序并选择排名靠前的股票。例如,选取得分最高的前 20%股票,或者选取得分最高的 50 到 100 只股票等等。打分法操作简单,但是权重的确定比较困难,对结果的影响较大

l 模型的评价和改进:

注意:因子和参数的获取只能通过历史数据回测来获得,但是在回测过程中,要防止出现过度优化。

来源:反转乌托邦

推荐阅读:

1.市面上经典的量化交易策略都在这里了!(源码)

2.海龟交易法则策略,多读几遍少走10年路

3.配对交易—这个股票策略曾年赚5000万美元

4.揭开日内回转交易策略做“T+0”的面纱

5.被动与主动的完美结合:指数增强策略的魅力

6.网格交易法,一个不容易亏钱的投资策略(附源码)

标签:组合,股票,模型,因子,量化,选股,多因子,收益率
来源: https://blog.csdn.net/weixin_42219751/article/details/98197669