2019级 利用投资者情绪因子预测A股指数收益率实证研究

2020年07月28日
信息来源:
浏览次数:
打印

从左至右依次为:符灿、徐超、张晓铭、王翊鹤
 
本文为清华-康奈尔双学位金融MBA2019级“数据分析与创业决策”课程报告,作者是第五小组:符灿、徐超(组长)、张晓铭、王翊鹤。授课教师:余剑峰。余教授现为清华大学五道口金融学院建树金融学讲席教授、清华大学金融科技研究院副院长、清华大学国家金融研究院资产管理研究中心主任。2014-2015年期间为清华大学五道口金融学院的访问教授。2011年起是美国联邦储蓄银行(达拉斯)的研究员。他主要从事行为金融和宏观金融的理论和实证研究,研究成果已经发表在多份学术刊物,例如,美国经济评论、金融期刊、金融经济期刊、货币经济期刊、管理科学和动态经济评论等。余教授获得中国科技大学概率统计学学士,耶鲁大学统计学硕士和宾夕法尼亚大学沃顿商学院的金融学博士。他的研究成果曾获得多项奖项,其中包括 Smith-Breeden一等奖。
 
利用投资者情绪因子预测A股指数收益率实证研究
 
研究背景
 
有学术研究成果认为投资者的情绪能够影响资产价格,当投资者情绪高涨时会过于乐观地追高资产价格,而投资者处于情绪低潮时则会过于消极从而对资产定价偏低,造成了投资者情绪引起的系统性偏差。但投资者情绪并非一个可以直接观测的变量,Malcolm Baker 和 Jeffrey Wurgler 在他们2006年发表的论文Investor Sentiment and the Cross-Section of Stock Returns中利用主成份分析法(Principle Component Analysis, PCA),通过6个可观测变量构建了投资者情绪因子,他们发现这个情绪因子对个股收益率具有较强的预测功能。Dashan Huang等人在其2013年发表的论文Investor Sentiment Aligned: A Powerful Predictor of Stock Returns进一步研究发现如果利用偏最小二乘法来构建投资者情绪因子,在预测股指收益率上一样具有明显效果。
   
在Baker和Wurgler的研究中,他们利用PCA中的第一主成份作为投资者情绪因子的代表,因为PCA的第一主成份能够最大解释6个可观测变量的方差。但是Dashan Huang等人认为这6个可观测变量中都包含了对不可观测的投资者情绪因子的逼近误差,所以第一主成份中可能包含了与待预测收益率无关的逼近误差。相比而言,偏最小二乘法(Partial Least Square, PLS)是为了构建对待预测变量最具预测效果的主成份而提出的一种数值方法,Dashan Huang等人利用这种方法构建的投资者情绪指标与 Baker和Wurgler所采用的方法相比,预测效果有了较大幅度的提升。这篇报告试图通过在A股投资实践中机构投资者关注较多的情绪因素重新构建投资者情绪因子,将沪深300指数作为市场整体,构建该指数的投资者情绪因子体系,希望对投资者有借鉴意义。
 
投资者情绪因子构造方法
 
目前学术界提议过一系列的指标成份用于构建投资者情绪因子,但是并没有确定无争议的情绪因子衡量工具,我们首先回顾一下学术界认可度比较高的Baker和Wurgler的 2006 年论文和Dashan Huang等人2013年论文提出的方法,使用6个可观测成份因素去构建投资者情绪因子。

(1) 封闭式基金贴现率(Close-end fund discount rate):指市场流通的封闭式基金资产净值与其市价之差。研究认为该指标与情绪因子呈现负相关,可以预测指数的反转。
   
(2) 换手率(Share turnover): 定义为相应股票指数成份股换手率的市值加权平均。当股票市场存在卖空限制时,如果投资者对未来乐观就会参与进而给市场贡献流动性,因此当市场流动性好的时候,往往就是市场整体估值过高的时候。一般高换手率预示着后期低的市场回报率。
 
(3) IPO 数量(Number of IPOs): 月频或周频的新股上市数量。
 
(4) IPO 收益率(Return of IPOs): 新股上市一周最后一个交易日价格与其发行价相比的收益率取对数并除以上市天数,对所有新股收益率取平均。

(5) 分红溢价(Dividend premium): 将相应股票指数成份股根据过去一年的分红情况分为有分红股票和无分红股票。Baker和Wurgler研究认为一般情况下高分红的公司是大公司,成长机会相对较小。

(6) 新股发行占比(Equity share in new issues): 每月或每周新股发行额度占新股发行和公司债发行总和的比例。Baker和Wurgler研究认为,在美股市场上高新股发行占比意味着未来低的市场收益率。
   
但考虑到以下因素:(1) 在A股市场IPO的发行节奏是受监管政策影响较大;(2)A股 IPO 的发行定价目前还不完全市场化,公司IPO一周内收益都较为可观,IPO收益率指示意义不明显;(3) 上市公司分红率受到自身经营周期和监管政策影响;同时结合机构投资者在A股的投资实践,我们决定重新构建投资者情绪因子,我们试图测量的维度包括以下几个方面:
 
(1) A股周成交量;
(2) A股周换手率;
(3) 融资交易额/总交易额;
(4) 涨停个数占比;
(5) 沪深300指数溢价率;
(6) 沪深300指数股息率;
(7) 恒生AH股溢价指数;
(8) 封闭式基金贴现率;
 
投资者情绪因子的效果
 
Dashan Huang和Baker等人在验证投资者情绪因子在美国市场的有效性时使用的时间序列频率为月度数据。一方面从实际交易的角度上说,投资者希望能及时地调整仓位;但另一方面市场情绪对市场的影响可能需要一段时间才能显现。因此这篇报告分别从短期和中长期两个期限维度考察市场情绪对股指的影响。我们选取的数据范围为2017.01.01-2020.4.24,数据来源为Wind,考察这段时间内上述八个情绪测量维度对沪深300指数的预测效果。
 
1、短期影响
   
本报告我们将短期限定为1周和1个月,考察情绪对股指的影响。
 
(1) A股周成交量
 
将一周后或一个月后的沪深300指数作为被解释变量,用回归模型计算得出结果如下:
 

回归统计(月频)   回归统计(周频)
Multiple R 0.250463189   Multiple R 0.298100671
R Square 0.062731809   R Square 0.08886401
Adjusted R Square 0.056981697   Adjusted R Square 0.083375239
标准误差 293.0615474   标准误差 289.8748173
观测值 165   观测值 168
 
可以看出,成交量和指数预测之间的相关性较弱。一个可能的解释是成交量受多种因素影响,比如市场整体流动性、政策等,对股指未来的指向性不明确。
 
(2) A股周换手率
 
我们选取A股周换手率作为自变量,将一周后或一个月后的沪深300指数作为被解释变量。用回归模型计算得出结果如下:
 

回归统计(月频)   回归统计(周频)
Multiple R 0.241114494   Multiple R 0.28265935
R Square 0.058136199   R Square 0.079896308
Adjusted R Square 0.052357894   Adjusted R Square 0.074353515
标准误差 293.779138   标准误差 291.2978464
观测值 165   观测值 168
   
可以看出,换手率和短期指数预测之间的相关性较弱,对股指未来的指向性不明确。
 
(3) 融资交易额/总交易额
 
选取融资交易额/总交易额作为自变量,月度和周度的回归结果如下:
 

回归统计(月频)   回归统计(周频)
Multiple R 0.641047595   Multiple R 0.715825067
R Square 0.410942019   R Square 0.512405527
Adjusted R Square 0.407328166   Adjusted R Square 0.509468211
标准误差 232.3303366   标准误差 212.0548814
观测值 165   观测值 168
 
可以看出融资买入额占比对指数预测的解释力较好,特别是周度数据,R平方达到0.51。说明当市场融资买入占比高时,市场情绪较高,短期对市场指数有一个向上的拉动。
 
 
 
(4) 涨停公司占比
 
选取周度涨停公司占比作为自变量,月度和周度的回归结果如下:
 

回归统计(月频)   回归统计(周频)
Multiple R 0.092950023   Multiple R 0.129761431
R Square 0.008639707   R Square 0.016838029
Adjusted R Square 0.002557742   Adjusted R Square 0.010915367
标准误差 301.3995915   标准误差 301.1143293
观测值 165   观测值 168
 
可以看出,涨停公司占比和指数预测之间的相关性较弱,对股指未来的指向性不明确。
 
(5) 沪深300风险溢价
 
我们将沪深300风险溢价作为自变量,考察该变量与沪深300指数未来走势的相关性。其中风险溢价的计算方法为沪深300指数市盈率PE(TTM)的倒数1/PE(TTM)与十年期国债到期收益率的差值。用回归模型计算得出结果如下:
 

回归统计(月频)   回归统计(周频)
Multiple R 0.442970648   Multiple R 0.491486267
R Square 0.196222995   R Square 0.241558751
Adjusted R Square 0.19135162   Adjusted R Square 0.237044219
标准误差 272.2803613   标准误差 265.2316004
观测值 167   观测值 170
 
可以看出,风险溢价对未来的股指有一定的解释力,周度数据解释力度更好。当沪深300指数风险溢价较高时,也即指数处于相对低位,市场短期对市场走势较为悲观,从而股指有向下的压力。
 
 
 
(6) 恒生AH股溢价指数
 
我们将AH股溢价指数作为自变量,考察该变量与沪深300指数未来走势的相关性。其中恒生AH股溢价指数是由香港恒生指数服务公司于2007年7月9日正式对外发布的数据,追踪在内地和香港两地同时上市的股票(内地称A股,香港称H股)的价格差异。用回归模型计算得出结果如下:
 

回归统计(月频)   回归统计(周频)
Multiple R 0.731393809   Multiple R 0.713199169
R Square 0.534936904   R Square 0.508653055
Adjusted R Square 0.532135319   Adjusted R Square 0.505745676
标准误差 206.6044321   标准误差 212.9777927
观测值 168   观测值 171
 
可以看出恒生AH股溢价率对指数预测的解释力较好,特别是月度数据,R平方达到0.53。说明当AH溢价率高时,市场情绪较高,短期对市场指数有一个向上的拉动。
 

 
(7) 封闭式基金溢价率
 
选取封闭式基金溢价率作为自变量,月度和周度的回归结果如下:
 

回归统计(月频)   回归统计(周频)
Multiple R 0.276212755   Multiple R 0.251897701
R Square 0.076293486   R Square 0.063452452
Adjusted R Square 0.07037229   Adjusted R Square 0.057562215
标准误差 291.3998598   标准误差 293.0953932
观测值 158   观测值 161
 
可以看出,短期封闭式基金溢价率和指数预测之间的相关性较弱,对股指未来的指向性不明确。
 
(8) 沪深300股息率/十年期国债收益率
 
我们将沪深300股息率/十年期国债收益率作为自变量,考察该变量与沪深300指数未来走势的相关性。用回归模型计算得出结果如下:
 

回归统计(月频)   回归统计(周频)
Multiple R 0.337107812   Multiple R 0.37454097
R Square 0.113641677   R Square 0.140280938
Adjusted R Square 0.108302169   Adjusted R Square 0.135193843
标准误差 285.2255051   标准误差 281.7205124
观测值 168   观测值 171
   
可以看出,股息率/十年期国债收益率对未来的股指有一定的解释力,周度数据解释力度更好。当沪深300指数股息率较高时,也即指数处于相对低位,市场短期对市场走势较为悲观,从而股指有向下的压力。
 

 
总结来看,在短期恒生AH股溢价率、融资买入额占比、沪深300风险溢价和沪深300股息率/十年期国债收益率等情绪因子对市场影响较大,可以作为股指短期预测的情绪指标。
 
2、中长期影响
   
本报告我们将短期限定为6个月和12个月,考察情绪对股指的影响。同时考虑到12个月时间的滞后性,我们将数据范围修改为2016.01.01-2020.4.24,数据来源为Wind。
 
(1) A股周成交量
 
将6个月后或一年后的沪深300指数作为被解释变量,用回归模型计算得出结果如下:
 

回归统计(6个月)   回归统计(1年)
Multiple R 0.235467877   Multiple R 0.005246137
R Square 0.055445121   R Square 2.75219E-05
Adjusted R Square 0.048793326   Adjusted R Square -0.005996409
标准误差 298.3565296   标准误差 303.6777065
观测值 144   观测值 168
 
可以看出,成交量和中长期指数预测之间的相关性较弱。
 
(2) A股周换手率
 
选取A股周换手率作为自变量,将6个月后或一年后的沪深300指数作为被解释变量。用回归模型计算得出结果如下:
 

回归统计(6个月)   回归统计(1年)
Multiple R 0.252433973   Multiple R 0.065425623
R Square 0.063722911   R Square 0.004280512
Adjusted R Square 0.05712941   Adjusted R Square -0.001717798
标准误差 297.0463   标准误差 303.0312315
观测值 144   观测值 168
 
可以看出,换手率和中长期指数预测之间的相关性较弱,对股指未来的指向性不明确。
 
(3) 融资交易额/总交易额
 
选取融资交易额/总交易额作为自变量,月度和周度的回归结果如下:
 

回归统计(6个月)   回归统计(1年)
Multiple R 0.197463628   Multiple R 0.508693281
R Square 0.038991884   R Square 0.258768854
Adjusted R Square 0.032224222   Adjusted R Square 0.254330344
标准误差 300.9438528   标准误差 261.7336007
观测值 144   观测值 169
 
可以看出融资买入额占比对中长期指数预测有一定解释力。说明当市场融资买入占比高时,容易推高股指,导致后期股指有向下回落的压力。
 
 
(4) 涨停公司占比
 
选取周度涨停公司占比作为自变量,月度和周度的回归结果如下:
 

回归统计(6个月)   回归统计(1年)
Multiple R 0.008066156   Multiple R 0.184254647
R Square 6.50629E-05   R Square 0.033949775
Adjusted R Square -0.006976732   Adjusted R Square 0.028130195
标准误差 306.9784015   标准误差 298.4824084
观测值 144   观测值 168
   
可以看出,涨停公司占比和中长期指数预测之间的相关性较弱,对股指未来的指向性不明确。
 
(5) 沪深300风险溢价
 
将沪深300风险溢价作为自变量,考察该变量与沪深300指数中长期走势的相关性。其中风险溢价的计算方法为沪深300指数市盈率PE(TTM)的倒数1/PE(TTM)与十年期国债到期收益率的差值。用回归模型计算得出结果如下:
 

回归统计(6个月)   回归统计(1年)
Multiple R 0.065050781   Multiple R 0.390154289
R Square 0.004231604   R Square 0.15222037
Adjusted R Square -0.002683454   Adjusted R Square 0.147233431
标准误差 308.0071598   标准误差 281.1719676
观测值 146   观测值 172
   
可以看出,风险溢价对长期的股指有一定的解释力。当沪深300指数风险溢价较高时,也即指数处于相对低位,股票相对债券类资产收益率更有吸引力,从而吸引机构买入权益资产,进而推高股指。
 
 
 
(6) 恒生AH股溢价指数
 
将恒生AH股溢价率作为自变量,考察该变量与对应沪深300指数中长期走势的相关性。用回归模型计算得出结果如下:
 

回归统计(6个月)   回归统计(1年)
Multiple R 0.3357582   Multiple R 0.684446377
R Square 0.112733569   R Square 0.468466844
Adjusted R Square 0.10661449   Adjusted R Square 0.465376534
标准误差 289.8371614   标准误差 222.5163867
观测值 147   观测值 174
   
可以看出恒生AH股溢价率对指数中长期的预测解释力也较好,特别是年度数据,R平方达到0.47。说明当AH溢价率高时,市场情绪较高推高股指,但长期市场有回落压力。与短期正向影响不同,长期两者相关系数为负。
 
 
 
(7) 封闭式基金溢价率
 
选取封闭式基金溢价率作为自变量,月度和周度的回归结果如下:
 

回归统计(6个月)   回归统计(1年)
Multiple R 0.025476036   Multiple R 0.492852432
R Square 0.000649028   R Square 0.24290352
Adjusted R Square -0.006753571   Adjusted R Square 0.235957681
标准误差 314.4087042   标准误差 270.8942059
观测值 137   观测值 111
 
可以看出封闭式基金溢价率对长期指数预测有一定解释力。说明当封闭式基金溢价率高时,市场情绪高涨容易推高股指,导致后期股指有向下回落的压力。
 
 
 
(8) 沪深300股息率/十年期国债收益率
 
我们将沪深300股息率/十年期国债收益率作为自变量,考察该变量与沪深300指数中长期走势的相关性。用回归模型计算得出结果如下:
 

回归统计(6个月)   回归统计(1年)
Multiple R 0.156771835   Multiple R 0.387509123
R Square 0.024577408   R Square 0.150163321
Adjusted R Square 0.017850356   Adjusted R Square 0.14522241
标准误差 303.8949249   标准误差 281.3614249
观测值 147   观测值 174
   
可以看出,股息率/十年期国债收益率对长期的股指有一定的解释力。当沪深300指数股息率较高时,也即指数处于相对低位,权益资产相比固收类资产投资价值凸显,从而吸引投资者买入,进而推高股指。与短期负向影响不同,长期两者相关系数为正。
 

 
总结来看,在长期恒生AH股溢价率、融资买入额占比、封闭式基金溢价率、沪深300风险溢价和沪深300股息率/十年期国债收益率等情绪因子对市场影响较大,可以作为股指长期预测的情绪指标。
   
结果讨论
 
这篇报告我们以沪深300指数为例,从短期和长期两个维度分别介绍了A股机构投资者关注的情绪因子对股指的影响。与市场预期略有不同的是,市场普遍关注的成交量、换手率等情绪指标对股指不管是短期还是长期指向都非常有限。恒生AH股溢价率在短期和长期都是一个较为有效的情绪指标来衡量股指的未来走势。一个可能的解释是,A股目前的投资者结构还是以散户为主,情绪化操作比较明显;而H股的投资者结构以机构为主,投资注重基本面比较理性。因此两地上市公司的溢价水平能较好地衡量股指脱离基本面的情绪因素。当然随着A股投资者结构的日趋机构化,该指标能否继续有效还有待后续跟踪。此外,由于A股和H股的做空及相关交易机制也存在差别,整个市场对负面情绪反应的方式也不同,也是恒生AH股溢价率的一个重要影响因素。
 
另一个值得投资者关注的情绪指标是融资买入额占比。当市场赚钱效应明显时,投资者往往会通过加杠杆的方式来投资股市,从而进一步推高股市;反之市场赚钱效应不明显时,融资买入占比就会下降。其余封闭式基金溢价率、沪深300风险溢价和沪深300股息率/十年期国债收益率可以作为投资者观测市场情绪因子的补充指标。
 
另外,我们可以看到情绪因子短期和长期对市场的影响完全不同。在短期不管市场上升还是下降,情绪会持续一段时间,这种动量效应短期对市场有加速上升或者加速下降的影响;但在长期我们可以看到情绪因子对市场影响与短期完全相反,当投资者情绪高涨时会过于乐观地推高资产价格,导致资产价格在长期回落;而投资者处于情绪低潮时则会过于消极打压资产价格,从而导致股票价格与其基本面信息出现背离,也为价值投资者创造了好的入场时机。通过本文的实证研究发现,A股市场情绪造成的动量效应在短期内显著存在,但是在长期会发生反转现象。
 
本研究分析的不足
 
因时间和资源限制,本研究仅针对沪深300指数2016-2020.04的数据进行了回归分析,时间跨度不够长。另外中小盘一直是个人投资者喜欢炒作的对象,受情绪影响更大,本报告未对创业板指、中小盘指进行回溯分析;
 
在情绪因子的挖掘上,本报告选取了机构投资者日常关注的常见指标。衡量情绪的因子很多,在该指标体系的选择上还有优化的空间;
 
情绪因子对股指的影响较为复杂,短期和长期影响不一。如何判断情绪的拐点可能对机构投资者更有意义,但限于篇幅本文未进一步展开,后续可以情绪拐点因子上进一步挖掘。
 
参考文献
1.余剑锋,Behavioral Finance 课程讲义 4_BiasFriction_Based_Strategies
2.王健,余剑锋,理性的非理性金融. 中信出版社,2018.
3.Baker M , Wurgler J . Investor Sentiment and the Cross-Section of Stock Returns[J]. Nber Working Papers, 2004.
4.Dashan, Huang, Fuwei. Investor Sentiment Aligned: A Powerful Predictor of Stock Returns[J]. Rev.financ.stud, 2015.

 

本文系学生个人观点,不代表清华大学五道口金融学院及金融MBA教育中心立场,转载请联系作者授权。

近期活动