美章网 资料文库 金融资产配置中的因子面板研究范文

金融资产配置中的因子面板研究范文

本站小编为你精心准备了金融资产配置中的因子面板研究参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

金融资产配置中的因子面板研究

《统计研究杂志》2014年第六期

一、因子面板数据随机波动模型

金融资产收益率的变动特征刻画主要基于波动率和随机干扰项的共同作用,随机波动模型的研究主要体现在随机波动项的设定上。鉴于随机波动率的不可测性以及正定性,除了采用因子模型以外,还可以采取矩阵指数变换、Cholesky分解以及Wishart模型等来反映随机波动项的协方差成分。这些设定一方面是为了体现随机波动对收益率的影响模式,另一方面也是为了在模型估计、诊断检验和模型比较时获得好的效果。由于金融资产价格变动影响因素的复杂性,很难得出哪种方法更为有效的一致性结论,所以随机波动项的设定需要根据具体的数据类型来确定。因子面板数据随机波动模型由于包含协变量、不可观测因子以及随机误差项,其随机波动性既可以体现在公因子部分,也可以体现在随机误差项中。本文主要考虑统计因子和基础因子两种类型的公因子,其中统计因子包含了某些不可观测的影响因素。通过这样的设定,能够有效地简化随机误差项的结构。其中,rit(i=1,2,…,N,t=1,…,T)表示第i项金融资产在第t时期的对数收益率。假设资产收益率不仅受以往波动率的影响,还受其他一些可观测与不可观测因素的影响。与一元随机波动模型和多元随机波动模型类似,面板随机波动模型同样包括两个部分:均值方程和波动方程。一般情形下,我们可以考虑采用变系数随机效应面板数据模型来反映可观测和不可观测的因子对金融资产收益的影响。这样,面板数据随机波动模型均值部分设定为:对于均值方程式(1)和式(3),后者采用因子分解来表示随机效应和固定效应,在简化模型随机误差项的结构的同时增强了模型的解释意义。由于因子模型的公因子代表了市场外部的共同冲击,在金融资产分析中表示资产价格的变动受某些不可观测因素的共同影响。在解释变量中选定某些可观测的影响因素,比较直接地体现了影响资产价格变动的某些客观因素。波动方程式(2)和式(4)分别反映随机波动项的条件自回归异方差性和共同影响因素的滞后效应。所以式(1)-式(4)能够对金融资产的平均收益和条件波动做出合理解释。

二、面板数据因子模型的贝叶斯估计

按照分块抽样的思路,协变量系数βi可以作为一个单独的块进行讨论。由于βi反映了解释变量对被解释变量的影响程度和影响方向,在因子面板数据随机波动模型中,βi的估计结果和因子分解一起决定了波动方程和动态因子方程中潜变量的取值和模型的估计结果。λi和ft作为面板随机波动模型的因子载荷和公因子,可以同时进行估计。相比较而言,λi的估计更加复杂,其自由参数较多。如果将ft看作潜在解释变量,在ft取值给定的情况下,λi的估计过程和解释变量系数βi类似,除了参数有所区别外,其后验分布的类型相同。在实际应用中,潜变量hit和qjt虽然来自不同的参数变换,但是二者的变换形式相同,仅仅只有分层分布参数不同,所以估计过程的设定相似。由于潜变量和波动方程的结构类似,我们将采取相同的方法对两组不同的波动方程的系数(αi0,αi1)和(φj0,φj1)进行估计。(一)βi后验分布推断不失一般性,此处我们仅仅考虑个体随机系数面板数据模型。面板数据模型按照解释变量的系数是否随个体变化分为固定系数模型和随机系数模型。随机系数模型是指各个解释变量的系数依个体而变动,这样,各个个体无论是模型的截距项还是斜率项都不同。由于我们在此考虑的解释变量主要是影响资产价格变动的可观测因素,不同的个体之间这些观测因素差别较大,选择固定系数不能很好地体现该差异,所以选择随机系数模型。同时,与其他线性回归模型的贝叶斯估计类似,面板数据随机系数模型的估计也可以采用非分层贝叶斯方法和分层贝叶斯方法。在面板数据随机波动模型中,采用分层贝叶斯方法能够充分利用相关的数据对计算结果不断进行检查,便于找出合适的条件后验分布。所以此处随机系数模型解释变量的系数βi设定为与个体有关,并且采用分层先验的形式。

式(3)的误差项与波动方程有关,所以其似然函数非常复杂。为了便于说明问题的方便,我们首先假设βi(i=1,2,…,N)不存在个体之间的交互效应。其分层先验是从正态分布中独立提取出来,这样根据Koop(2003),本文假设。由前面对误差项以及因子项的分析可知,随机系数βi的后验分布参数不仅与随机误差项有关,而且与因子分解的结果有关。为了便于对相关参数的算法进行设计,我们总可以采用某种基础变换,使得个体随机系数模型的误差项均值为0N,方差—协方差矩阵为M-1IN,下标N表示矩阵的阶数,M为误差精度。这样,在给定观测数据和误差精度的情况下,就可以设定βi的后验分布参数,为采用Gibbs抽样对其进行估计做准备。由于βi的后验分布不仅与先验信息和实际数据有关,还受模型的误差精度M影响,所以模型剩余部分的设定将直接影响相关参数的估计。与一般面板数据随机效应模型相比,因子面板数据随机波动模型的误差精度不仅与随机误差项有关,而且受因子分解结果的影响。(二)λi后验分布设定为了便于对因子载荷矩阵λi进行识别,需要添加一定的识别条件。在此,假设λi为下三角矩阵,进而其元素λij=0(i<j,i=1,…,N,j=1,…,p)。对于因子面板数据随机波动模型,λij的先验分布可以设定为:其中,1(•)为示性函数。对面板随机波动模型的误差成分进行因子分解是为了分析不可观测因素对个体和时间的影响。在面板数据固定效应部分β''''ixit已经设定的条件下,因子分解可以看做是对已知信息集的扩展,从中得出公共因子以及相应的特定系数。因子载荷矩阵的非零元素的后验分布仍然服从正态分布。由于公因子个数p一般远小于原始变量的个数N,因子载荷阵的组成元素的后验分布与其所处位置有关。波动项ht的共轭后验分布参数由此得出,其中波动方程的系数主要由波动项的生成过程确定。设定好波动项分层先验参数和后验参数后,随机波动项的系数可以采用MCMC结合粒子滤波算法给出。

在因子随机波动模型中,动态线性分层模型(DLHM)式(35)-(39)代表了随机波动过程的演进步骤。由于对数误差波动部分采用了分块的方法,通过构造块hT实现对N个独立的随机波动过程的系数αi进行联合估计,这样能够有效提高运算效率得出合理估计结果。对数误差波动项ht与联合系数αi的后验分布设定过程的主要区别在于分块移动能改变ht的后验分布的类型。式(35)已经给出了采用独立的单个随机波动项的分布,即正态分布。如果对块hT进行抽样,其分布类型将不再满足原有条件。对一元随机波动模型,Chib等人(2002)[12]采用Kim等人(1998)提出的7个成分正态分布作为对数χ2分布的近似。对于多元随机波动模型和面板随机波动模型,由以上所假设的独立条件,在将多元波动方程进行分解后,N个变量分解成了N个独立的一元随机波动过程,在均值方程的随机误差项满足对数χ2分布的条件下,同样可以采用7成分正态分布对随机波动项的分布予以近似。此时,随机误差项所服从的对数χ2分布可以表示为:

三、金融资产收益的影响因素分析

在一元和多元随机波动模型的基础上,面板随机波动模型从数据类型方面进行了扩展,将模型的研究对象从一元时间序列数据和多元时间序列数据推广到了面板数据,并考察了更多影响资产价格和收益率变动的因素。其中,不可观测因素用潜在因子表示。整个模型由三部分组成,包括面板均值方程、波动方程和因子方程。均值方程体现了资产的平均收益,波动方程主要是为了刻画金融资产的波动特征,因子方程反映不可观测的影响因素。与传统模型相比,面板因子随机波动模型的构建主要是在多元随机波动模型的建模思路上引进面板数据模型的分析方法,进一步在因子随机波动模型的基础上研究潜在波动性。由前文的分析可知,与多元随机波动模型相比,尤其是与多元因子随机波动模型相比,因子面板数据随机波动模型不仅能够分析被解释变量受某些不可观测因素影响,还能够具体度量可观测因素的影响程度大小。由于随机效应模型系数随个体的变化而变化,通过对个体影响因素的分析,能够合理实现资源配置,优化投资组合,以及控制金融资产的风险。所构建的模型虽然形式上比较复杂,但是各组成部分具有明确的现实意义,分别反映了金融资产收益率的波动特征和主要影响因素。为了具体分析金融资产配置的各种影响成分,尤其是不可观测的影响因素,本文采用中国股票市场的数据,利用因子面板数据随机波动模型研究金融资产收益变动的几个影响因素。此处随机选取了中国股票市场上海证券交易所上证50指数的20只成分股,涵盖银行、证券、钢铁、地产、通信、贸易、建筑、汽车、能源和采矿等10大行业,具体股票代码见表1和表2。为了便于显示,省略了每只股票代码前面共有的三个数字“600”,例如“000”代表“600000”浦发银行。数据来源于国泰安数据中心的CSMAR数据库,原始数据交易日期从2010年4月8日至2012年12月31日,时间跨度为1000天。考虑这些日期有的不是交易日,有的交易日部分股票因种种原因临时停牌,为了研究的需要,最终只保留了股票均进行交易并且具有可比性的499个交易日的数据。

我们主要根据以上设定的因子面板数据随机波动模型分析影响多元资产收益率变动的某些可观测和不可观测因素。由于场外因素的复杂性,在此仅考虑场内因素。被解释变量为每只股票的非预期收益率(考虑分红派现等因素),解释变量包括每日交易量(股,记为“Vol”)、交易金额(元,记为“Amo”)以及流通市值(千元,记为“Val”)的变动,即一阶差分变换。最后进行标准化,得到三个解释变量Var1、Var2、Var3,该变换过程可以表示为。其中,下标t表示时间,表示个体的下标i省略,μ和σ分别表示下标对应变量的均值和标准差。标准化的目的是为了对比可观测因素对被解释变量的影响强度。均值方程设定为不包含常数项的个体随机系数面板数据因子模型,具体形式同式(1)-(4)。采用联合估计得出因子载荷和模型系数的估计结果。此处提取了三个公因子,公因子个数的选择方法根据Bai和Ng(2002)。三个因子载荷的估计结果见表1,个体随机系数的估计结果见表2。从表1可以看出,各个个体的因子载荷的分布并不均匀。与经典的多元因子分析不同,在因子模型中,我们并没有将因子载荷进行正交旋转,因为此处的目的是为了体现资本收益率受某些共同因素的作用结果。这三个公因子虽然没有具体含义,但是代表了三个共同的潜在影响因素。对所研究的20只股票进行分析,因子“1”上载荷值较大的股票包括五矿发展(058)、包钢稀土(111)、阳泉煤业(348)和江西铜业(362)等。因子“2”上载荷较大的股票有华夏银行(015)、民生银行(016)和招商银行(036)等。因子“3”载荷值总体较小,上汽集团(104)和兖州煤业(188)等股票受因子“3”影响较大。各个公因子在不同股票上的因子载荷大小体现了这些股票的冲击程度。如果能确定这些公因子的来源,在构建投资组合时,可以考虑采用这些不可观测信息针对各个因素的来源增加投资收益。

协变量系数估计虽然与潜在因子和因子载荷的估计同时进行,但是从模型的结构可以理解为提取出公共因素以后再分析各个个体受可观测因素影响的程度。在对原始变量进行标准化处理之后,能更加明显地观察三个解释变量作用于被解释变量的方向和程度。从表2可知,每日流通市值的变动(var3)相对于交易量(var1)和交易额(var2)的变动对收益率的影响更大,其系数估计结果也更为显著。由表2,每个变量系数估计结果的下方为对应变量的估计标准误差,选取5%的显著性水平,除了交易额(var2)在华夏银行(015)的估计结果不显著外,其他各变量的系数估计均通过了5%的显著性检验。从表2估计结果可知,除了包钢股份(010)和江西铜业(362)交易额(var2)的变动与股票收益率为负相关关系,其余变量在所有股票上系数估计结果为正数,都表现为正相关关系。可以解释为当交易量或者流通市值增加时,所有股票收益率呈上升趋势。当交易额增加时,除了包钢股份(010)和西铜业(362)收益率呈下降趋势外,其余股票均呈上升趋势。表2还可以进一步观测每只股票的收益率与各个变量的变动的具体影响大小。在金融资产配置的分析中,与多元因子模型一样,面板因子模型缺乏较好的预测效果。因为因子随机波动模型包含许多可观测因素,对被解释变量进行预测时,首先要能获取这些可观测因素的信息。正如一个硬币有两面一样,因子面板数据随机波动模型在资产配置构建和风险管理中,可以直观地分析这些可观测因素对构建投资组合和风险的影响,并且能够分析不同金融资产之间的差异,如上例中包钢股份(010)和江西铜业(362)所表现出的特点。选择可观测因素时,还可以选择场外因素,尤其是一些通过大众渠道可以获取的场外消息,经过量化以后,可以加入模型中,这样就能全面考虑股票市场风险控制中市场风险和系统性风险。应用例子进一步证实面板数据因子随机波动模型能较好拟合股票市场金融资产收益率受可观测和不可观测因素共同影响的时变波动性和异方差特征。

四、结论

因子面板数据随机波动模型与一般因子随机波动模型相同之处在于存在两个波动方程,这两个波动方程分别代表了资产的随机波动和共同冲击。虽然估计时我们将两个波动方程合并成了一个,然而由于因子面板数据随机波动模型加入了可观测因素,依赖于内部数据的多元MCMC算法并不能直接采用被解释变量或者金融资产收益率数据,因此必须采取某种联合估计方法。同时,由于模型中可观测和不可观测部分的估计方法不一致,因此面板随机效应模型与滤波和抽样算法需要整体考虑,本文采用的是前向滤波倒向抽样整体估计算法。模型中可观测因素可以包括资本市场内部因素和外部因素,在金融资产影响因素的应用分析中,仅仅考虑了市场内部因素。前面已经说明,之所以没有考虑市场外部因素是由于其较难量化,另外一个原因是我们认为采用面板数据因子模型可以分别通过公因子来反映共同冲击,由于共同冲击既有对整个市场的冲击,也有针对某个行业或某只股票的冲击,所以在进行部分行业随机波动比较时,可以采用行业因子代替潜在因子,此时模型结构类似于Fama和French(1992)的基础因子模型。

分层贝叶斯估计中,各个参数的先验分布和后验分布参数(超参数)的设定对MCMC算法的收敛速度有一定影响。进行应用分析时,在参数分布形态已经确定的情况下,根据经验数据来选择先验参数仍然很重要。由于需要设定的参数较多,并且在因子面板数据模型中需要考虑协变量的经验分布,因此先验参数的设定不仅与解释变量有关,还与被解释变量有关。在实行分块抽样时,充分考虑到了各部分之间的相互联系。由于金融资产收益率同时受可观测的市场因素和不可观测的潜在因素的影响,不可观测因素受某些随机因素的驱动,因此可以在多元随机波动模型的基础上,考虑可观测因素和潜在因子对收益率波动特征的刻画。高维面板数据随机波动模型包括大量参数和潜在因子需要估计。本文引入了基于FFBS的联合估计方法对模型进行估计,潜在波动性的设定在给出某些提议的先验信息基础上通过研究其平稳后验分布实行。应用例子进一步证实了面板数据因子随机波动模型能够较好地拟合股票市场金融资产收益率的时变波动性和异方差特征,可以用于构建投资组合和风险管理。

作者:方国斌张波单位:安徽财经大学统计与应用数学学院副教授中国人民大学应用统计科学研究中心专职研究员