【原】必读! 动态面板模型为啥比静态的好? 一篇搞清楚动态面板模型, 附代码解读和案例.

【原】必读! 动态面板模型为啥比静态的好? 一篇搞清楚动态面板模型, 附代码解读和案例.

之前推荐过一系列动态面板模型的帖子,具体如下。今天,结合之前的帖子整理一下动态面板模型的应用场景、估计方法、软件代码和案例等等。通过这个帖子,我们可以掌握动态面板模型的相关知识,对这个领域也会变得驾轻就熟。核心要点是把动态面板想成是时间序列里的那种AR(p)过程,理解起来就容易多了。#计量圈面板数据 #计量圈系统GMM 关于动态面板,1.动态面板数据模型及其运用, 差分广义矩和系统广义矩估计,2.计量大牛白聚山教授, 是这样讲解动态面板分析的,3.动态面板模型的王冠—系统GMM什么鬼?4.把动态面板命令讲清楚了,对Stata的ado详尽解释,5.动态面板回归和软件操作,单位根和协整检验(Dynamic Panel Data)标准的静态面板模型通常设定为:yit=α+Xit′β+uit,其中 uit=μi+νit,μi 是个体特定的、不随时间变化的效应(个体异质性),νit 是随个体和时间变化的干扰项。

动态面板数据模型则在此基础上,将被解释变量的滞后项作为解释变量引入模型。一个简单的一阶自回归(AR(1))动态面板模型形式如下:yit=ρyi,t−1+Xit′β+μi+νit,其中,∣ρ∣<1 通常被假定以保证过程的稳定性。ρ 衡量了被解释变量的持续性或状态依赖性,即过去的 y 对当前的 y 有多大影响。这就相当于时间序列中的AR(1)模型。

在许多经济学应用中,当前的决策或结果往往受到过去行为或状态的影响。例如:当期投资可能受上期投资(资本存量的调整成本)的影响;当期消费可能受上期消费习惯(习惯形成)的影响;当期雇佣量可能受上期雇佣水平(雇佣和解雇成本)的影响;当期经济增长可能与前期的增长水平相关(趋同或惯性)。

在这些情况下,静态模型忽略了这种动态依赖性,可能导致模型设定偏误。如果真实的生成过程是动态的,而研究者估计了静态模型,那么动态部分可能会被遗漏到误差项中,导致估计量产生偏误。动态模型能够更准确地刻画数据的生成过程,区分变量的短期冲击效应和长期累积效应。

动态面板模型 vs. 静态面板模型

动态面板模型(使用 GMM 估计)相对于传统的静态面板模型(如固定效应 FE 或随机效应 RE 估计,现在都是默认FE了)具有以下主要优势。

能够捕捉状态依赖性,最核心的优势在于能够直接估计和检验被解释变量的持续性或惯性 (ρ)。这对于理解经济过程的动态调整机制至关重要。静态模型隐含地假设 ρ=0,如果真实情况并非如此,则模型设定错误。处理特定类型的内生性,1.滞后被解释变量,DPD GMM 方法专门设计用于处理由包含 yi,t−1 和 μi 共同引起的内生性问题(Nickell 偏误),而标准 FE/RE 在此情况下是有偏的。2.其他内生/前定变量,GMM 框架很容易扩展,允许模型中的其他解释变量 Xit 是内生的(与同期 νit 相关)或前定的(与过去的 νis 相关,但与当前和未来的 νit,νi,t+1,... 不相关)。只需为这些变量选择合适的(通常是更滞后的)工具变量即可。而标准 FE/RE 模型通常要求所有 Xit 都是严格外生的(与所有时期,包括过去、现在和未来的 νis 都不相关),这是一个非常强的假设,在许多经济应用中难以满足。区分短期和长期效应,动态模型允许研究者区分解释变量对被解释变量的即期(短期)影响(系数 β)和累积(长期)影响(例如,β/(1−ρ),这是不是就是AR的长期效应? 😄),提供了更丰富的经济含义。静态模型只能估计一个单一的效应,无法区分短期与长期。可能减少遗漏变量偏误,包含滞后被解释变量有时可以作为控制随时间缓慢变化的遗漏变量的一种代理方式。选择动态还是静态模型?

在理论上,经济理论是否支持变量之间存在动态调整过程或状态依赖性?例如,是否存在调整成本、习惯形成、预期等机制?从实证上,估计一个动态模型,检验滞后被解释变量的系数 ρ 是否显著不为零。此外,估计一个静态模型,检验其残差是否存在显著的序列相关性。如果存在序列相关,可能表明遗漏了动态成分。可以使用 xtserial (Stata) 或类似检验。从研究问题上,研究的核心是关注长期均衡关系还是短期动态调整?从数据上,T 是否足够小以至于 Nickell 偏误显著?N 是否足够大以支持 GMM 估计?如果理论和实证证据都支持动态设定,则应使用动态面板模型。如果缺乏强有力的理由,静态模型可能更简洁,且避免了 GMM 估计的复杂性和潜在问题。动态面板模型在经济学中的应用

动态面板模型(尤其是 GMM 估计方法)因其能够处理持续性和内生性问题,在经济学的各个领域得到了广泛应用。

宏观经济增长领域,研究经济增长的决定因素,如资本积累、人力资本、研发投入、制度质量、金融发展、贸易开放度、通货膨胀等对人均 GDP 增长率的影响。动态设定可以捕捉增长的惯性或趋同效应,GMM 则可以处理解释变量(如投资、贸易)的潜在内生性。例如,研究发现疫苗接种和经济投资对短期 GDP 有显著正向影响,而政府消费比例和疫情严格指数有负向影响。也有研究利用动态面板探讨贸易与增长的双向关系。

公司金融领域,分析企业投资行为(如 Q 理论模型,投资受过去投资、托宾 Q 值、现金流等影响)、资本结构决策(目标杠杆率的动态调整)、股利政策、公司治理与绩效关系等。动态模型可以刻画调整成本或市场摩擦导致的缓慢调整过程。

劳动经济学领域,建模劳动力需求(就业调整,如 Arellano-Bond 1991 的经典应用)、劳动力供给、工资决定(工资粘性或持续性)、工会效应、最低工资影响、教育回报率等。例如,研究发现滞后工资对当期工资有显著影响,表明工资存在很强的持续性。也有研究使用动态面板分析国际劳工标准与经济增长的关系。

国际贸易领域,考察贸易自由化、关税变化、汇率波动等对贸易流量(出口、进口)或经济绩效的动态影响。例如,研究贸易开放度对长期增长的影响,发现对非 OECD 国家效果更强。动态模型可以帮助区分贸易政策的短期和长期效果。

家庭行为领域,分析家庭消费和储蓄的动态模式,如基于欧拉方程检验跨期替代弹性,研究流动性约束、预防性储蓄动机、收入冲击的持续性影响等。

动态面板模型中的内生性问题(早在本科或研究生课本上就学过)

在动态面板模型中包含滞后被解释变量 yi,t−1 会引入特定的内生性问题,即使在静态模型中 Xit 是外生的,标准的面板估计方法(如固定效应的组内估计量或一阶差分估计量)也会变得有偏和不一致,尤其是在 T 较小而 N 较大的微观面板数据中。

主要的内生性来源是 yi,t−1 与复合误差项 uit=μi+νit 的相关性。

1.与个体效应 μi 的相关性:

yi,t−1 是由过去的 y 值决定的,而过去的 y 值(如 yi,t−2,yi,t−3,...)都受到个体效应 μi 的影响。因为 μi 是个体固有且不随时间变化的特征,它会影响该个体所有时期的 y 值。因此,yi,t−1 必然与 μi 相关,即 E(yi,t−1μi)≠0。

这导致在原始水平方程中使用 OLS时,即使 νit 与 yi,t−1 不相关,也会因为 yi,t−1 与误差项中的 μi 相关而产生偏误。

2.与变换后误差项的相关性(Nickell 偏误):

为了消除固定效应 μi,常用的方法是组内离差或一阶差分。

2.1.组内离差(固定效应估计):该变换从每个变量中减去其个体均值:,,。变换后的方程为。问题在于,包含了的均值,而包含了的均值。由于 yi,t−1 与 νi,t−1 相关(通过模型本身),y~i,t−1 会与 ν~it 中的 νˉi 部分相关,导致。这种由组内变换(或类似地,由一阶差分变换)在动态模型中引入的偏误被称为Nickell 偏误。

Nickell 偏误的大小约为 −(1+ρ)/(T−1)(对于只有 LDV 的模型),在 T 较小时(如微观面板常见的 T=5 或 T=10)非常显著,且不随 N 增大而消失。当 ρ>0 时,该偏误是负向的,导致对持续性 ρ 的估计向下偏误(低估)。

2.2.一阶差分:该变换从当期值减去上一期值:Δyit=yit−yi,t−1。变换后的方程为 Δyit=ρΔyi,t−1+ΔXit′β+Δνit。虽然 μi 被消除了,但新的内生性问题仍然存在。Δyi,t−1=yi,t−1−yi,t−2 包含了 yi,t−1,而 Δνit=νit−νi,t−1 包含了 νi,t−1。由于 yi,t−1 与 νi,t−1 相关(通过模型),导致 Δyi,t−1 与 Δνit 相关,即 E(Δyi,t−1Δνit)≠0。

因此,动态面板模型中滞后被解释变量的内生性问题根植于模型结构本身以及消除个体效应的标准变换方法。这使得传统的 OLS、FE、RE 估计量均不适用,需要采用基于工具变量(IV)或广义矩估计(GMM)的方法来获得一致估计。

主要的动态面板模型估计方法

为了解决动态面板模型中的内生性问题,特别是 Nickell 偏误,研究者发展了基于广义矩估计(GMM)的方法。GMM 利用模型假设所蕴含的矩条件来构造估计量。最主要的两种方法是 Arellano-Bond (1991) 的差分 GMM 和 Blundell-Bond (1998) 的系统 GMM。这些方法特别适用于 N 大 T 小的面板数据。

1.Arellano-Bond (差分 GMM) 估计量

Arellano-Bond (AB)估计量,有时也称为差分GMM,建立在Holtz-Eakin, Newey, and Rosen (1988) 的工作基础上。

1.1一阶差分消除个体效应:首先对模型进行一阶差分,以消除不随时间变化的个体固定效应 μi。Δyit=ρΔyi,t−1+ΔXit′β+Δνit

1.2.利用滞后水平值作为工具变量:差分后,解释变量 Δyi,t−1 仍然与差分误差项 Δνit 相关(因为两者都包含 νi,t−1)。为了解决这个内生性问题,差分GMM 方法使用滞后水平值作为 Δyi,t−1 的工具变量。

这里的核心假设是,原始误差项 νit 不存在序列相关,即 E(νitνis)=0 对于t≠s。同时,假定解释变量 Xit 是前定或严格外生 的(相对于 νit)。在上述假设下,对于差分方程(时间从 t=3 开始),yi,t−2 与 Δνit=νit−νi,t−1 是不相关的,因为 yi,t−2 只依赖于 νi,t−2,νi,t−3,...。同时,yi,t−2 与内生变量 Δyi,t−1 是相关的(只要 ρ≠0)。因此,yi,t−2 是一个有效的工具变量。不仅 yi,t−2,所有更早的滞后水平值 yi,t−3,yi,t−4,...,yi1 都是有效的工具变量。Arellano 和 Bond (1991) 指出,随着时间 t 的推移,可用的工具变量数量会增加。例如,在 t=3 时,只有 yi1 可用作工具;在 t=4 时,yi1,yi2 都可用作工具,以此类推。GMM 框架允许有效地利用所有这些可用的矩条件:E(yi,t−sΔνit)=0对于t≥3,s≥2 。对于其他前定或内生的解释变量 ΔXit,也可以使用其适当滞后的水平值作为工具变量。3.GMM 估计:利用这些矩条件,通过 GMM 框架求解参数 ρ 和 β。GMM 寻找能使样本矩尽可能接近于零(即满足正交条件)的参数值。

一步 GMM,使用一个假定误差项 Δνit 为独立同分布(或至少是同方差)的初始权重矩阵进行估计。两步 GMM,使用一步 GMM 的残差构造一个更有效的(允许异方差和序列相关,尽管差分GMM 假设 νit 无序列相关)权重矩阵,然后重新估计。理论上两步 GMM 更有效率,但小样本下标准误可能向下偏误。Windmeijer (2005) 提出了小样本修正方法。差分GMM 适用条件是,N大T小的面板数据;模型存在动态性(ρ≠0);原始误差项νit不存在序列相关(这是工具变量有效性的关键);解释变量Xit 至少是前定的。

差分GMM可能存在的问题是弱工具变量问题,当被解释变量 yit 具有高度持续性(即 ρ 接近 1)时,滞后水平值 yi,t−s 对其差分值 Δyi,t−1 的预测能力会很弱。这是因为当 yit 接近随机游走时,yi,t−s 与 Δyi,t−1 的相关性趋于零。同样,如果个体效应 μi 的方差相对于 νit 的方差很大,也会导致工具变量变弱。弱工具变量会导致 GMM 估计量产生严重的有限样本偏误,且精度下降。

2.Blundell-Bond (系统 GMM) 估计量

为了解决差分 GMM 在持续性序列中可能出现的弱工具变量问题,Blundell 和 Bond (1998) 在 Arellano 和 Bover (1995) 的工作基础上提出了系统 GMM估计量。系统 GMM 通过增加额外的矩条件来提高估计效率和减少偏误。

2.1.结合差分方程和水平方程,系统 GMM 同时估计一个由差分方程和水平方程组成的方程系统。

差分方程——与差分 GMM 相同为 Δyit=ρΔyi,t−1+ΔXit′β+Δνit。

水平方程——原始模型的水平形式为 yit=ρyi,t−1+Xit′β+μi+νit。

2.2.为水平方程增加工具变量,系统 GMM 的关键创新在于为水平方程引入了额外的工具变量。差分 GMM 只使用了差分方程的矩条件。系统 GMM 使用滞后差分值作为水平方程中内生变量(如 yi,t−1 和 Xit)的工具变量。

核心附加假设是,除了差分 GMM 的假设外,系统 GMM 需要一个关于初始条件的额外假设,即个体效应 μi 与被解释变量的初始差分(或后续差分)不相关,即 E(μiΔyi2)=0(或更一般地,E(μiΔyit)=0对于t=2,3,...)。这个假设意味着,尽管 μi 可能与 yit 的水平值相关,但它与 yit 的变化量不相关。这通常被解释为过程在初始时期(或均值上)是平稳的。

在这个附加假设下,对于水平方程,yi,t−1 的差分值 Δyi,t−1=yi,t−1−yi,t−2 可以作为 yi,t−1 的有效工具变量。因为 Δyi,t−1 与 μi 不相关(根据附加假设),并且与水平方程的误差项 νit 也不相关(只要 νit 无序列相关)。同时 Δyi,t−1 与 yi,t−1 显然是相关的。

系统GMM 使用的矩条件包括差分方程的矩条件(同差分 GMM):E(yi,t−sΔνit)=0 对于t≥3,s≥2和水平方程的矩条件:E(Δyi,t−1(μi+νit))=0 对于t≥3。类似地,对于其他内生或前定变量 Xit,也可以使用其滞后差分 ΔXi,t−1 等作为水平方程的工具变量。

2.3.GMM 估计,在一个统一的 GMM 框架内,利用来自差分方程和水平方程的所有矩条件来估计参数。同样存在一步和两步估计量。

它适用条件为N 大 T 小的面板数据;模型存在动态性;原始误差项 νit 不存在序列相关;解释变量 Xit 至少是前定的;关键附加假设:初始条件假设 E(μiΔyit)=0 成立。

当被解释变量序列具有强持续性(ρ 接近 1)或个体效应方差较大时,系统 GMM 通常比差分 GMM 表现更好,估计量偏误更小、效率更高。这是因为它利用了水平方程中的信息,而滞后差分作为水平方程的工具变量在这种情况下通常不是弱工具;结合了差分和水平信息,可能更稳健。

然而,系统GMM需要更强的假设,依赖于关于初始条件的额外假设,如果该假设不成立,系统 GMM 的估计量可能不一致。此外,还存在工具变量过多问题,即系统 GMM 使用的矩条件比差分 GMM 多得多。随着 T 的增加,工具变量的数量会迅速膨胀(与 T2 成比例)。过多的工具变量可能导致过度拟合内生变量,使得估计量在有限样本中偏向于有偏的 OLS 或组内估计量,弱化 Sargan/Hansen 检验,过度识别检验的功效降低,可能无法拒绝无效的工具变量,导致检验结果过于乐观(例如,p 值接近 1)。实践中通常需要限制工具变量的数量,例如限制滞后阶数或使用 Roodman (2009) 提出的 collapse 选项(将工具矩阵折叠成更小的集合)。

差分 GMM vs. 系统 GMM比较

适用场景

差分 GMM,当序列持续性不强(ρ 显著小于 1)且个体效应方差相对较小时,差分 GMM 的假设较弱,可能是足够的。系统 GMM,当序列具有强持续性(ρ 接近 1)或个体效应方差很大时,差分 GMM 的工具变量可能很弱,导致估计偏误和效率低下。此时,如果初始条件假设合理,系统 GMM 通常是更好的选择。优劣总结

差分 GMM,假设较弱,实现相对简单。但在持续性序列中表现不佳。系统 GMM,在持续性序列中表现更好,效率更高。但依赖更强的初始条件假设,且更容易遇到工具变量过多的问题,需要更谨慎地选择和限制工具变量。使用选择的建议

通常建议同时估计两种模型并比较结果。如果结果差异很大,需要仔细检查假设的合理性(特别是系统 GMM 的初始条件假设)和工具变量的有效性。进行稳健性检验,如限制工具变量滞后阶数或使用 collapse 选项,观察结果是否稳定。动态面板 GMM 估计量在主流统计软件中都能实现

Stata 提供了多个命令用于估计动态面板模型,主要包括 xtabond、xtdpdsys、xtdpd 以及xtabond2。

1.xtabond: 实现 Arellano-Bond (1991) 差分 GMM 估计量。

基本语法: xtabond depvar indepvarsin,默认使用一阶差分,并自动使用 y 的滞后水平值(从 t-2 开始)作为 Δyi,t−1 的工具变量。默认将 indepvars 视为严格外生变量,并使用其差分值作为自身的工具。

2.xtdpdsys: 实现 Arellano-Bover (1995) / Blundell-Bond (1998) 系统 GMM 估计量。

基本语法: xtdpdsys depvar indepvarsin,同时估计差分方程和水平方程。差分方程使用滞后水平值作工具(同 xtabond)。水平方程默认使用 y 的滞后差分值(通常是 Δyi,t−1)作为 yi,t−1 的工具。默认将 indepvars 视为严格外生变量。

3.xtdpd: 提供更灵活的 GMM 框架,允许精确指定模型和工具变量结构,可以处理更复杂的模型,例如误差项存在 MA(q) 序列相关或更复杂的前定变量结构。语法相对复杂,需要用户手动指定 GMM 式工具 (dgmmiv, lgmmiv) 和标准 IV 式工具 (iv)。

4.xtabond2: 集成了差分 GMM 和系统 GMM,并提供了更多选项来控制工具变量矩阵(如 gmmstyle(), ivstyle(), laglimits(), collapse),以及更全面的检验输出。语法与官方命令有所不同,需要显式指定滞后被解释变量和工具变量。

常用选项 (适用于 xtabond, xtdpdsys, xtdpd, xtabond2 有类似选项)。

lags(#): 模型中包含的被解释变量滞后阶数 p (默认 1) 。pre(varlist [, lagstruct(min, max)]): 指定 varlist 为前定变量。GMM 式工具使用其水平值的滞后(通常从 t-1 或 t-2 开始,最多到 max 阶)。endogenous(varlist [, lagstruct(min, max)]): 指定 varlist 为内生变量。GMM 式工具使用其水平值的滞后(通常从 t-2 开始,最多到 max 阶)。maxldep(#): 限制用作工具的 depvar 滞后水平值的最大阶数。maxlags(#): 类似地限制 pre 和 endogenous 变量的工具滞后阶数。twostep: 使用两步 GMM 估计(默认一步)。vce(robust): 计算对异方差和组内自相关稳健的标准误。对于两步 GMM,通常包含 Windmeijer 小样本修正。noconstant: 模型不包含常数项。artests(#): 报告 Arellano-Bond 序列相关检验结果,最高到 # 阶(默认 2)。xtabond2 特有选项: gmmstyle(), ivstyle() 用于指定变量及其工具变量的类型和滞后;collapse 用于减少工具数量;robust 隐含 vce(robust);noleveleq 强制只估计差分 GMM。基本操作流程

xtset panelvar timevar: 声明面板数据。xtabond depvar xvars, lags(p)... 或 xtdpdsys depvar xvars, lags(p)... 或 xtabond2 depvar L.depvar xvars, gmm(...) iv(...)...: 估计模型。estat abond: (仅用于官方命令后) 进行 Arellano-Bond 序列相关检验 。estat sargan: (仅用于官方命令后) 进行 Sargan/Hansen 过度识别检验。(xtabond2 会自动报告这些检验)。R 中最常用的实现动态面板 GMM 的包是 plm,library(plm)

设定检验与结果解读

在使用 GMM 估计动态面板模型后,必须进行一系列设定检验,以评估模型假设的有效性,特别是关于误差项序列相关性和工具变量有效性的假设。

1.序列相关检验 (Arellano-Bond tests)

这些检验的核心目的是验证 GMM 估计量有效性的关键假设——原始(水平)误差项 νit 不存在序列相关。如果 νit 存在序列相关,那么例如 yi,t−2 可能与 Δνit 相关,从而导致工具变量无效。检验是针对差分后的残差 Δν^it 进行的。

AR(1) 检验,检验原假设 H0:E(ΔνitΔνi,t−1)=0。预期结果,拒绝 H0 (即 p 值 < 0.05 或 < 0.10)。理由是,如果原始误差 νit 是序列不相关的,那么一阶差分 Δνit=νit−νi,t−1 必然会引入负的一阶序列相关(因为 Δνit 和 Δνi,t−1 都包含 νi,t−1)。因此,拒绝 AR(1) 的原假设是符合预期的,它本身并不表明模型有问题。可能的异常情况包括,如果未能拒绝 AR(1) 的 H0 (p 值较大),这反而可能暗示原始误差 νit 本身存在正的序列相关,这会使得 GMM 估计所依赖的标准假设失效。AR(2) 检验,检验原假设 H0:E(ΔνitΔνi,t−2)=0。预期结果: 不拒绝 H0 (即 p 值 > 0.05 或 > 0.10)。理由是,如果原始误差 νit 序列不相关,那么 Δνit=νit−νi,t−1 和 Δνi,t−2=νi,t−2−νi,t−3 之间应该没有相关性。不拒绝 AR(2) 的原假设,是支持“νit 无序列相关”这一关键假设的重要证据,从而支持了使用 yi,t−2 及更早滞后项作为工具变量的有效性。异常情况包括,如果拒绝了 AR(2) 的 H0 (p 值较小),则表明原始误差 νit 可能存在二阶或更高阶的序列相关,这违反了标准 GMM 估计的假设,使得 yi,t−2 等工具变量无效,估计结果不可信。此时可能需要使用更滞后的工具变量(例如 yi,t−3 作为 Δyi,t−1 的工具),或者考虑 xtdpd 命令允许的更复杂的误差结构。要记住,理想的检验结果是 AR(1) 检验显著,而 AR(2) 检验不显著。2.过度识别检验 (Sargan/Hansen test)

目的是,当使用的工具变量数量严格多于模型中内生解释变量的数量时,模型是过度识别的。过度识别检验(也称 J 检验)用于检验这些“多余的”工具变量是否满足其有效性的基本条件,即它们与误差项正交(不相关)。检验的原假设 H0 是,所有工具变量都是有效的(即与误差项不相关,且被正确地排除在模型之外)。Sargan 检验,由 Sargan (1958) 提出,适用于假定误差项条件同方差的情况。通常与一步 GMM 结果一起报告 。Hansen 检验,由 Hansen (1982) 提出,是 Sargan 检验在允许异方差情况下的推广。它适用于两步 GMM 估计量,并且通常被认为是更稳健的检验,尤其是在使用两步 GMM 时。预期结果是,不拒绝 H0 (即 p 值较大,例如 > 0.10)。不拒绝原假设意味着没有足够的证据表明工具变量是无效的,这支持了模型的设定和 GMM 估计结果的有效性。异常情况包括,如果拒绝了 H0 (p 值较小),则表明至少有一部分工具变量可能与误差项相关,即工具变量无效。这严重质疑了整个 GMM 估计结果的可靠性。需要重新审视模型设定或工具变量的选择。正如之前提到的,特别是在系统 GMM 中,当 T 相对较大时,工具变量的数量可能变得非常庞大,甚至超过 N。这会导致过度识别检验(尤其是 Hansen 检验)的功效大大降低,几乎总是不拒绝原假设(p 值趋近于 1),从而失去其检验能力,给人以虚假的“模型通过检验”的印象。因此,一个非常高(如 > 0.8 或 > 0.9)的 Hansen 检验 p 值,或者工具变量数量接近或超过 N 时,应引起警惕 。建议检查工具变量数量,并通过限制滞后阶数或使用 collapse 选项来减少工具数量,进行稳健性检验。差分 Sargan/Hansen 检验,可以用来检验工具变量的一个子集是否有效,例如检验系统 GMM 中用于水平方程的工具变量是否有效。3.系数解读

滞后被解释变量系数 (ρ^),衡量状态依赖性或持续性的程度。ρ^ 越接近 1,表示 y 的持续性越强,过去的 y 对当前的 y 影响越大。ρ^ 的大小也影响着其他变量的长期效应。

其他解释变量系数 (β^),表示在控制了过去的 y 和个体效应后,Xit 变化一个单位对 yit 的短期或即期影响。

至于长期效应,对于一个稳定的动态过程 (∣ρ^∣<1),解释变量 X 的一个永久性变化对其产生的长期累积效应可以通过短期效应 β^ 和持续性参数 ρ^ 计算得出。在一个简单的 AR(1) 模型中,长期效应为 β^/(1−ρ^) 。这表示 X 变化一个单位最终会导致 y 变化多少。计算长期效应需要 ρ^ 显著不为零且小于 1。

案例研究——动态劳动力需求模型 (Arellano & Bond, 1991)

Arellano 和 Bond (1991) 的研究是动态面板 GMM 方法应用的开创性工作之一。

1. 研究问题

该研究旨在估计英国制造业企业的动态劳动力需求函数,即企业雇佣水平如何随时间调整,并受工资、资本存量和产出等因素的影响。关键在于要控制不随时间变化的企业特定效应(如管理效率、技术水平差异等),并处理由雇佣调整成本或惯性引入的动态性(雇佣的滞后项)以及解释变量(如工资)的潜在内生性。

2.模型设定

Arellano 和 Bond (1991) 考虑了一个包含两阶滞后被解释变量和多项解释变量及其滞后项的模型。一个典型的设定(基于其论文表 4(a))可以写为(所有变量取对数)

nit=α1ni,t−1+α2ni,t−2+β1wit+β2wi,t−1+β3kit+β4ki,t−1+β5ki,t−2+β6ysit+β7ysi,t−1+β8ysi,t−2+yr1980+...+yr1984+μi+νit

其中:nit: 企业 i 在 t 期的雇佣对数值。wit: 实际产品工资对数值。kit: 总资本存量对数值。ysit: 行业产出对数值(作为需求的代理变量)。yr1980−yr1984: 年度虚拟变量,用于控制宏观经济冲击。μi: 企业特定的固定效应。νit: 特异性(idiosyncratic)误差项。

模型包含了雇佣的两阶滞后项,表明雇佣调整可能比较缓慢。工资、资本和产出也包含滞后项,允许它们对雇佣的影响存在时滞。

3.数据,使用的是一个非平衡面板数据,包含 140 家英国制造业公司在 1976-1984 年间的数据。这是一个典型的 N 大(N=140)T 小(最多 T=9)的微观面板数据集,非常适合应用 GMM 估计方法。

4.估计策略 (差分 GMM),Arellano 和 Bond (1991) 主要使用了差分 GMM 估计量:

1.差分,对模型进行一阶差分以消除 μi。2.工具变量,对于差分后的内生变量 Δni,t−1 和 Δni,t−2,使用 ni,t−2,ni,t−3,... 作为工具变量。对于差分后的工资 Δwit,Δwi,t−1,资本 Δkit,Δki,t−1,Δki,t−2,以及产出 Δysit,Δysi,t−1,Δysi,t−2,假设它们是前定或内生的,使用它们各自的滞后水平值(例如 wi,t−2,ki,t−2,ysi,t−2 等及更早滞后)作为工具变量。年度虚拟变量的差分被视为严格外生,用作自身的工具。3.估计,使用 GMM 框架,结合上述所有矩条件进行估计。他们报告了一步和两步 GMM 的结果。5.结果解读 (基于 Arellano & Bond, 1991, 表 4a 的典型结果)

雇佣的滞后项ni,t−1 的系数 (α^1) 通常显著为正且较大,表明雇佣水平具有很强的持续性。ni,t−2 的系数 (α^2) 通常显著为负,这与包含调整成本的理论模型一致,意味着过度调整后会有回调。当期实际工资 wit 的系数 (β^1) 显著为负,符合劳动力需求曲线向下倾斜的理论预期。即工资上升,雇佣下降。滞后工资 wi,t−1 的系数也可能显著,反映工资变化的滞后影响。资本存量 kit 及其滞后项的系数反映了资本对劳动力需求的(替代或互补)效应。行业产出 ysit 及其滞后项的系数通常为正,表明行业需求扩张会增加企业雇佣。时间虚拟变量系数反映了相对于基准年(如 1979 年)的平均雇佣水平变化,捕捉了未被模型解释的宏观周期性因素。6.设定检验解读 (基于 Arellano & Bond, 1991 的典型结果)

AR(1) 检验,结果通常显示差分残差存在显著的负一阶自相关(p 值 < 0.05),符合预期 。AR(2) 检验,结果通常显示差分残差没有显著的二阶自相关(p 值 > 0.10),这是支持模型设定和工具变量有效性的关键证据。Sargan 检验,对于过度识别的模型,Sargan 检验的原假设(所有工具变量有效)通常不被拒绝(p 值 > 0.10),表明所使用的工具变量集合与(差分后的)误差项正交,支持了 GMM 估计的一致性。尽管 GMM 方法功能强大,但在实践中也可能遇到一些问题。

工具变量过多问题,尤其在使用系统 GMM 且 T 不算太小时,工具变量数量可能急剧增加,超过 N。这会导致估计量有限样本偏误增大,且过度识别检验失效。常用的解决方法包括:限制用作工具的滞后阶数(如 maxldep, laglimits),或使用 collapse 选项压缩工具矩阵。

弱工具变量问题,即使是系统 GMM,如果序列接近单位根或初始条件假设不强,工具变量也可能很弱,导致估计不精确且有偏。需要对结果的稳健性进行检查。

有限样本偏误问题,GMM 估计量是基于大 N 渐近理论的,在 N 较小或 T 相对较大时,可能存在显著的有限样本偏误。两步 GMM 的标准误尤其容易向下偏误,需要使用小样本修正(如 Windmeijer 修正)。

截面相关性问题,标准的 DPD GMM 估计假设误差项在个体之间是独立的。但在许多应用中(如国家间或区域间数据),可能存在空间溢出效应或共同冲击导致截面相关。处理这种情况需要更复杂的空间动态面板模型。

非线性模型问题,标准 GMM 命令通常针对线性模型。非线性动态面板模型的估计更为复杂。

替代估计方法

除了 GMM,还有其他一些估计动态面板模型的方法。

偏误校正的最小二乘虚拟变量估计,当 T 中等大小(例如 T > 10-15)且 N 不太大时,可以考虑直接估计固定效应模型(LSDV),然后对 Nickell 偏误进行解析或自助法校正。这种方法要求除了滞后被解释变量外的其他解释变量是严格外生的。Stata 中有 xtdpdbc 命令实现。

极大似然估计,在特定假设下(例如误差项服从正态分布,且对初始条件有明确假定),可以构建似然函数进行 ML 估计。一些研究认为 ML 估计量在有限样本中可能比 GMM 表现更好,尤其是在工具变量较弱时。但 ML 通常对严格外生性假设的要求比 GMM 更强(除了 LDV 外的变量需要严格外生)。Stata 中有 xtdpdml 和 xtdpdqml 命令。

因子分析方法估计,近年来,一些研究者(如 Bai, 2013,对,就是咱们熟悉的白聚山教授)提出了基于因子模型的动态面板估计方法,旨在处理更复杂的误差结构或异质性。

*可以进一步到社群交流讨论计量问题。一些社群学术讨论:1.“显著不显著的后背是什么, 非(半)参估计里解决内生性”,2.“计量社群里关于使用交互项还是中介效应分析开展机制研究的讨论”,3.“为啥面板数据回归中, 即使X对Y的解释程度很大, 但R-square一般都很小?”,4.多期DID中使用双向固定效应可能有问题! 又如何做平行趋势检验? 多期DID方法的最新进展如何?,5.收入和年龄等变量是将其转化成有序离散变量还是当成连续变量进行回归呢?6.控制变量就能影响结果显著性, 所以存在很大操作空间, 调参数是常用手段吗?7.回归中常数项显著说明模型中有遗漏变量问题?8.审稿人有义务告诉你回归中可能的遗漏变量么?9.针对很多实证问题的讨论, 随手保存的部分内容以飨学者,10.未引入交互项主效应为正, 引入后变为负, 解释出来的故事特别好, 主效应符号确实增强了故事性,11.双向固定效应多期DID最新进展和代码汇总, 关于控制变量和固定效应选取的讨论,12.逐年匹配的PSM-DID操作策略, 多时点panel政策评估利器,13.多期DID前沿方法大讨论, e.g., 进入-退出型DID, 异质性和动态性处理效应DID, 基期选择问题等,14.针对经济学领域中介效应模型问题的回应和理性讨论,15.讨论a(b)对b(a)的新方向论文, 经济学期刊分区问题, 3个机制存在时计量模型设计问题,16.如果解决了内生性, 那么是否意味着证实了变量之间的因果关系呢?17.解释变量提升一个标准差,被解释变量提升几个百分比呢?18.关于DID中对照组与处理组的比例问题?19.双重差分法和事件研究法的区别主要在哪里?20.双重差分法和事件研究法的区别主要在哪里?21.统计上不显著的变量表明该变量对结果变量没有影响吗?22.IV与Y在理论上无直接关系, 但用Y对IV做回归发现IV是显著的, 这是咋回事?23.Heckman模型和工具变量IV之间的差异?24.被质疑: X与Y相关系数与回归系数截然相反, 你咋想的?25.审稿人质问: 通篇都基于OLS估计, 却把它放到稳健性检验或进一步讨论中!26.异质性和机制检验都用交互项做会被审稿人质疑么? 27.所有控制变量都不显著行不行呢?审稿人啥看法,28.审稿人: 实证论文必须先提出假说, 再依次进行实证检验么?29.审稿人: 如何在双向固定效应下还能估计出不随个体变化的宏观变量呢?30.为啥我看到面板数据中可以估计出性别, 民族虚拟变量? 还是国内权威期刊下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。7年,计量经济圈近2000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle

数据系列:空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 | 夜间灯光 | 官员方言 | 微观数据 | 内部数据计量系列:匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理:Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列:能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多MIT研究生必备: 科研全流程指南(阅读,写作,选题,导师,心态等等), 彻底讲透研究生如何做研究前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

相关推荐

深圳婳美医疗美容医院靠谱吗?医生信息和项目收费全部公开
OPPO R17(CPH1879)OPPO R17(CPH1879) 升级卡刷详细图文和视频教程,ColorOS系统刷机教程刷机解锁
漫话金融
best365官网手机版

漫话金融

📅 08-02 👁️ 5212
同城急送
bet体育365官网怎么样

同城急送

📅 07-29 👁️ 990
升级戴尔显示器固件的步骤
bet体育365官网怎么样

升级戴尔显示器固件的步骤

📅 10-05 👁️ 281
世界十大名著电影
best365官网手机版

世界十大名著电影

📅 09-07 👁️ 2743