其他分享
首页 > 其他分享> > 数据分析-面板数据变系数模型

数据分析-面板数据变系数模型

作者:互联网

面板数据变系数模型

前言:在这一篇文章中,我们将某些影响因素的作用范围扩大,这些因素不仅影响截距项的变动,而且也能影响到斜率项。因素的作用范围就可能有一下几种组合,单独影响截距,单独影响斜率,既影响截距又影响斜率,既不影响截距也不影响斜率(随机效应)。因素又区分为两类,时间因素与个体特质因素。推荐先阅读数据分析-面板数据变截距模型 再阅读本文。

graph LR A[因素] --> B(时间因素) A --> C(个体特质因素) A-->A1[随机因素]-->G1[影响截距] & H1[影响斜率] & i1[影响截距与斜率] & N1[不影响截距,斜率] B--> G2[影响截距] & H2[影响斜率] & i2[影响截距与斜率] & N2[不影响截距,斜率] C --> G[影响截距] & H[影响斜率] & i[影响截距与斜率] & N[不影响截距,斜率]

为了方便理解,我们将包含个体特质与时间因素的面板回归方程拆写为:
\(Y_{it}=\alpha_0 +\alpha_i + \lambda_0 +\lambda_t + X_{it}' \beta_i+ X_{it}' \beta_t+ X_{it}' \beta_c + \varepsilon_{it}\)
\(\beta= \beta_i+ \beta_t + \beta_c\)
\(,i = 1,2,3,...,N;t=1,2,3,...,T\)
当然这里的\(\beta_t与\beta_i\)也可以像拆分 \(\alpha和\lambda\)一样,拆分出均值和差异项

项目 含义
\(i\) 个体标志序数
\(t\) 时间序数
\(X_{it}\) 观测变量,\(K*1\)向量,\((X_{1it,},X_{2it},..,X_{kit})'\)
\(\beta_i\) 随个体特质而变动的参数,\(K*1\)向量, \((0,0,...,\beta_i,..0)'\)
\(\beta_t\) 随时间而变动的参数,\(K*1\)向量, \((0,0,...,\beta_t,..0)'\)
\(\beta_c\) 不变动的参数,\(K*1\)向量, \((\beta_{1},\beta_{2},..0...,\beta_{k})'\)
\(\beta\) 总参数向量,\(K*1\)向量, \((\beta_{1},\beta_{2},...,\beta_i,...,\beta_t,...,\beta_{k})'\)
\(\alpha_0\) 个体效应在个体维度上的平均值
\(\alpha_i\) 个体效应在个体维度上差异
\(\alpha_0+\alpha_i\) 个体效应引起的截距项
\(\lambda_0\) 时间效应在时间维度上的平均值
\(\lambda_t\) 时间效应在时间维度上差异
\(\lambda_0 +\lambda_t\) 时间效应引起的截距项
\(\varepsilon_{it}\) 随机扰动项

固定系数模型

模型

以截距项为个体固定效应,系数为个体固定效应:
\(Y_{it}=\alpha_0 +\alpha_i +X_{it}' \beta_i + X_{it}' \beta_c + \varepsilon_{it}\)
以截距项为个体固定效应,系数为时间固定效应:
\(Y_{it}=\alpha_0 +\alpha_i +X_{it}' \beta_t + X_{it}' \beta_c + \varepsilon_{it}\)

估计方法

随机系数模型

这个模型是有局限性的:模型多多少少会忽略一些解释变量,因此会导致截距项与解释变量相关。所以说模型设置为个体固定效应的模型很正常。随机变系数效应模型的截距项也应该是随机的,截距项如果不是随机的最好不要用随机变系数效应模型。
模型举例:
Swamy随机模型:
\(Y_i=X_i\tilde{\beta_i}+\varepsilon_i,i=1,2,...,N\)
\(\tilde{\beta_i}=\beta_0+\beta_i\)
\(E(\beta_i)=0_{k *1},\)

\(E(\beta_i\beta_j')=\begin{cases} \Delta_i &\text{ }i=j \\ 0 &\text{ } i \neq j \end{cases}\);

\(E(X_{it}'\beta_i)=0\);

\(E(\varepsilon_i\varepsilon_j')=\begin{cases} \sigma_i &\text{ }i=j \\ 0 &\text{ } i \neq j \end{cases}\);

模型设定检验

由于我们不知道模型中哪些变量的系数是变动的,所以需要依据检验是否某个变量的系数是变动的

LR检验

\(Y_{it}=\alpha_0 +\alpha_i +\beta_1 x_{1it}+(\beta_{2}x_{2it}+ \gamma_1 x_{2it}*D_1+ \gamma_2 x_{2it}*D_2)+( \beta_{3}x_{3it} + \eta_1 x_{3it}*D_1+\eta_2 x_{3it}*D_2)+ \varepsilon_{it}\)
原假设:\(\gamma_1=\gamma_2=\eta_1=\eta_2=0\);(变量的系数不变动)
备择假设:\(\gamma_1,\gamma_2,\eta_1,\eta_2\)不全为0;(变系数模型)

LR检验的无约束回归方程(备择假设成立):
\(Y_{it}=\alpha_0 +\alpha_i +\beta_1 x_{1it}+(\beta_{2}x_{2it}+ \gamma_1 x_{2it}*D_1+ \gamma_2 x_{2it}*D_2)+( \beta_{3}x_{3it} + \eta_1 x_{3it}*D_1+\eta_2 x_{3it}*D_2)+ \varepsilon_{it}\)
计算\(lnL_u\)
LR检验的约束回归方程(原假设成立):
\(Y_{it}=\alpha_0 +\alpha_i + \beta_1 x_{1it}+\beta_{2}x_{2it}+ \beta_{3}x_{3it} + \varepsilon_{it}\)
计算\(lnL_r\)

Swamy检验

\(Y_i=X_i\tilde{\beta_i}+\varepsilon_i,i=1,2,...,N\)
\(\tilde{\beta_i}=\beta_0+\beta_i\)
\(E(\beta_i)=0_{k *1},\)
原假设:\(\beta_0=\beta_1=\beta_2=\beta_3=...=\beta_N\) (不变系数)
备择假设:\(\beta_0,\beta_1,\beta_2,\beta_3,...,\beta_N\)不全相等(变系数)

模型检验步骤

固定效应

LR逐次检验:

  1. 原假设:混合回归模型(截距与斜率都不变)
    备择假设:截距项与斜率项(k个变量)发生变化
    此时:不拒绝原假设,建立混合回归模型,检验结束;拒绝原假设,截距项与斜率项之中至少有一项在变化,因此进入下一步检验。

  2. 引入截距项的约束函数,验证是否成立
    原假设:变量的斜率变化 (约束条件成立)
    备择假设:截距项、变量的斜率变化(约束条件不成立)
    此时:不拒绝原假设,认为截距项不变。接下来要检验哪些变量的斜率发生变化;拒绝原假设,认为截距项变化,接下来需要检验截距项随时点变化、个体变化、个体时点变化,以及哪些变量的斜率发生变化。

  3. 在上一步原假设的基础上在引入任意k-1个关于变量系数的约束条件,有1个变量系数自由另外的k-1个约束条件的,认为这1个变量系数为模型唯一变动的变量系数,否则认为至少有2个变量系数变动。
    原假设:个体FX变截距,考察其中一个变量变化,另外k-1个变量不发生变化。
    备择假设:个体FX变截距,至少有两个变量系数变化。
    此时:不拒绝原假设,我们认为个体FE变截距,且只有一个变量斜率发生变动。检验结束。
    拒绝原假设,认为截距项发生变动,并且k-1个变量的斜率中至少有一个会变。继续检验。

  4. 减少1个约束条件个数,重复第三步检验。

graph LR A[模型检验,约束全部系数与截距项] -- 原假设 --> B[混合回归模型 : 截距与斜率都不变]-->B1[结束检验,建立混合回归模型] A --备择假设--> C[截距项和斜率项的k个变量斜率之中至少有一个发生变化,约束截距项] C --原假设--> C1[截距不变,变量的斜率变化]-->C11[引入k-1个约束,检测那个斜率变化]--原假设-->C12[约束条件成立,检测出,检验结束] C11--备择假设-->C13[认为有两个斜率变动,因此i减少约束条件个数] C13-->C11 C--备择假设-->C2[截距项与变量的斜率变化] C2--原假设-->D1[截距项变化,一个变量斜率变化,其余k-1个变量斜率不变化]-->E1[检验结束,建立变截距,1个变量系数变化的模型] C2--备择假设-->D2[截距项变化,所有的变量系数都发生变化,下一步检验减少约束条件个数] D2-->C2

随机效应原假设:混合模型

备择假设:截距项、所有变量(k个变量)的斜率都是随机效应。
此时:若不拒绝原假设,表明建立混合(pool)模型,检验到此结束。
若拒绝原假设,建立随机系数模型。
注意:随机系数模型的截距项也应该是随机效应。

建模步骤

graph LR A[输入数据]-->B[描述性统计分析]-->C[面板单位根检验] C--数据非平稳-->D[面板协整分析] C--数据平稳-->E[变截距检验] & F[变系数检验] F-->F1[固定系数检验] F1--不拒绝原假设-->FA[系数不变] F1--拒绝原假设-->FB[系数变动] F-->F2[随机系数检验] F2--不拒绝原假设-->FA1[系数不变] F2--拒绝原假设-->FB1[系数变动] E[F检验 or LR检验] --不拒绝原假设,意味着截距项不变动--> G[使用混合回归] E --拒绝原假设,意味着截距项变动--> H[豪斯曼检验] H --不拒绝原假设--> L[选择个体随机效应模型] H --拒绝原假设--> M[选择个体固定效应模型]

标签:数据分析,截距,系数,变量,--,斜率,beta,alpha,面板
来源: https://www.cnblogs.com/kuanleung/p/13930507.html