Welcome to R Square

虚拟变量回归模型

楚新元 / 2021-08-24


  本案例研究对象为美国 1970-1995 年间收入存储关系,案例来源:古扎拉蒂《经济计量学》(第 4 版,张涛译)例 6-4,详见第 145-147 页。

  表 1 给出了美国1970-1995年个人可支配收入(即税后收入)和个人储蓄,单位是10亿美元。目标是估计上述时期个人储蓄 \(Savings_{t}\) 和个人可支配收入 \(Income_{t}\) 的函数关系。

  为了估计储蓄函数,需要在整个区间上做 \(Savings_{t}\)\(Income_{t}\) 的回归。如果做这样的回归,则个人储蓄和个人可支配收入在整个样本区间内保持同样的关系。但这是一个不切实际的假设。众所周知,1982 年美国经历了和平时期最严重的经济衰退,当年的失业率达到 9.7%,创下了自 1948 年以来最高的记录。类似这样的事情可能会打破个人储蓄和个人可支配收入之间的关系。为了验证,我们把样本数据分为两个时期,1970-1981 年和 1982-1995 年,即分成萧条前后两个时期。

options(digits = 4)
library(readxl)
library(kableExtra)
data = read_xls("./data/Table6_7.xls")
data %>% 
  kable(
    caption = "美国个人储蓄和个人可支配收入(1970-1995年)",
    format = "html",
    booktabs = TRUE
  ) %>% 
  kable_styling(
    full_width = TRUE,
    font_size = 14
  ) %>% 
  add_footnote(
    label = "数据来源:总统经济报告,1997年,数据单位为十亿美元,摘自表B-28,第332页。",
    notation = "none"
  )
表 1:美国个人储蓄和个人可支配收入(1970-1995年)
YearSavingsIncomeD
197061.0727.10
197168.6790.20
197263.6855.30
197389.6965.00
197497.61054.20
1975104.41159.20
197696.41273.00
197792.51401.40
1978112.61580.10
1979130.11769.50
1980161.81973.30
1981199.12200.20
1982205.52347.31
1983167.02522.41
1984235.72810.01
1985206.23002.01
1986196.53187.61
1987168.43363.11
1988189.13640.81
1989187.83894.51
1990208.74166.81
1991246.44343.71
1992272.64613.71
1993214.44790.21
1994189.45021.71
1995249.35320.81
数据来源:总统经济报告,1997年,数据单位为十亿美元,摘自表B-28,第332页。

  原则上来说,能够分别对上述两个时期进行回归。但我们可以仅估计一个形式,只需要在模型中引入一个虚拟变量,比如 \(D_{t}\),1982 年以前赋值为 1,1982 年及以后赋值为 0。建立计量经济模型的表达式如下:

$$ Savings_{t}=\alpha_{1}+\alpha_{2} D_{t}+\beta_{1} Income_{t}+\beta_{2}\left(D_{t} Income_{t}\right)+u_{t} $$

  表 2 给出了回归结果。回归结果表明,差别截距 \(\alpha_{2}\) 和差别斜率 \(\beta_{2}\) 都是统计显著的,说明两个时期的储蓄-收入函数关系发生了改变。

fit1 = lm(Savings ~ Income, data = data)
fit2 = lm(Savings ~ D * Income, data = data)
fit1b = coef(fit1)
fit2b = coef(fit2)

library(stargazer)
stargazer(
  label = "tab:tb2",
  fit1, fit2,
  type = "html",
  title = "美国储蓄-收入关系的回归结果",
  dep.var.labels = "Savings", 
  intercept.bottom = FALSE,
  intercept.top = TRUE,
  header = FALSE,
  covariate.labels = c(
    "Intercept",
    "D",
    "Income",
    "D * Income"
  )
)
美国储蓄-收入关系的回归结果
Dependent variable:
Savings
(1)(2)
Intercept62.420***1.016
(12.760)(20.160)
D152.500***
(33.080)
Income0.038***0.080***
(0.004)(0.014)
D * Income-0.065***
(0.016)
Observations2626
R20.7670.882
Adjusted R20.7580.866
Residual Std. Error31.120 (df = 24)23.150 (df = 22)
F Statistic79.100*** (df = 1; 24)54.780*** (df = 3; 22)
Note:*p<0.1; **p<0.05; ***p<0.01

  根据表 2 结果,可以推导出两个时期的储蓄回归方程。

$$ \widehat{Savings_{t}} = 1.0161 + 152.4786 D_{t} + 0.0803 Income_{t} - 0.0655\left(D_{t} Savings_{t}\right) $$

  储蓄-收入:1970-1981年

$$ \begin{aligned} \widehat{Savings}_{t} = 1.0161 + 0.0803 Income_{t} \end{aligned} $$

  储蓄-收入:1982-1995年

$$ \begin{aligned} \widehat{Savings_{t}} &= (1.0161 + 152.4786) + (0.0803 - 0.0655) Income_{t} \\ &=153.4947 + 0.0149Income_{t} \end{aligned} $$

  可以看出,萧条前后两个时期的边际消费倾向(MPS,即收入美增加 1 个单位而增加的额外储蓄)存在显著差异。1970-1981 年的 MPS 为 8 美分,而 1982-1995 年的 MPS 仅为 1 美分。

  案例更多内容请参阅古扎拉蒂和波特著《经济计量学精要》。