没有合适的资源?快使用搜索试试~ 我知道了~
面板数据相关资料 wd.docx
0 下载量 3 浏览量
2022-10-14
15:35:15
上传
评论
收藏 820KB DOCX 举报
温馨提示
试读
50页
面板数据相关资料
资源推荐
资源详情
资源评论
面板数据 I——变截距模型
1.1 Pooled Cross Section 数据
Pooled cross section 数据是指不同时点(可能)不同截面的数据。而面板数据是指不同时
点相同截面的数据。在面板数据中,同一截面不同时点的观测值不会是独立的。因为,这些
数值可能受到共同因素的影响。Panel data 也叫做 longitudinal data。
混合数据增加了样本容量,因此提高了估计的精度和检验功效。同时,混合数据也被用
于考察变量分布随着时间的变化,或者变量之间的关系随着时间的变化规律。考察的方法是
加入时间虚拟变量。
例:National Opinion Research Center’s General Social Survey搜集了1972~1984年妇女就业、
家庭等相关数据。利用数据分析家庭小孩个数的变化规律。控制变量包括:教育程度、年龄、
种族、地区、生活环境(农村、城镇、小城市等)。(数据文件:fertil1.raw)
kids =
0
+
1
educ +
2
age +
3
age
2
+
4
race +
5
farm+
6
town
+
7
D74 +
8
D76 +
9
D78 +
10
D80 +
11
D82 +
12
D84 + u
t
例 : 接 受 教 育 程 度 对 工 资 的 影 响 以 及 工 资 的 性 别 差 异 ( File : cps.wfl ; data file:
cps78_85.raw)
模型设定:
log(wage) =
0
+
1
y85 +
2
educ +
3
y85educ +
4
exper +
5
union
+
6
female+
7
y85 female + u
t
模型估计:
结论分析:
例:废物焚化厂对周边房屋价格的影响 (File:kielmc.wfl;data file: kielmc.raw)
Kiel and McClain (1995)研究了废物焚化厂对周边(North Andover, Massachusetts)房屋价格的
影响。1978年有消息流传要在North Andover建立废物焚化厂,1981年正式动工(1985年正式
运营)。利用1978年、1981年的房屋价格数据检验:废物焚化厂周边的房屋价格低于远处的房
屋价格。房屋价格为实际价格(排除物价指数的影响)。
要分析废物焚化厂对周边房屋价格的影响,不能简单回归如下模型:
rprice =
0
+
1
nearinc + u,
比如利用1981年的数据进行回归,那么
1
体现了81年近处价格与远处价格的差异,但
1
没
有体现焚化厂对近处房屋价格的影响。因此,要分析焚化厂对近处房屋价格的影响,应该观
察近处与远处的房屋价格在1981的差异年是否比1978年的差异有了明显的变化。方程设定如
下:
rprice =
0
+
1
y81 +
2
nearinc +
3
(y81nearinc) + u,
其中,nearinc为0-1虚拟变量。
y81=0,nearinc =0,rprice =
0
+ u。因此,
0
体现了1978年远处的房屋平均价格。
y81=0,nearinc =1,rprice =
0
+
2
+ u。因此,(
0
+
2
)体现了1978年近处的房屋价格,
2
体现了1978年近处房屋价格与远处房屋价格的差异。
y81=1,nearinc =0,rprice =
0
+
1
+ u。(
0
+
1
)体现了 1981 年远处的房屋价格,
1
体现了远处房屋价格在 81 年与 78 年的差异。
y81=1,nearinc =1,rprice =
0
+
1
+
2
+
3
+ u。(
0
+
1
+
2
+
3
)体现了 1981 年近
处的房屋价格,(
2
+
3
)体现了 1981 年近处与远处的房屋价格差异。
这样可以清晰地看出,
3
体现了近处与远处的房屋价格在 1981 的差异年是否比 1978
年的差异。问题就归结于检验
3
的显著性。
练习题:
1. 回归方程,进行检验并解释其含义。
Log(rprice) =
0
+
1
y81 +
2
nearinc +
3
(y81nearinc) + u
2. 加入其它控制变量(房龄、距市中心距离、卧室数目等)重新回归方程进行检验。
1.2 面板数据定义
时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据;
截面数据是变量在截面空间上的数据。面板数据是同时在时间和截面上取得的二维数据。所
以,面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合
数据(pool data)。面板数据示意图见图 1。面板数据从横截面(cross section)上看,是由若
干个体(entity, unit, individual)在某一时期构成的截面观测值,从纵剖面(longitudinal
section)上看每个个体都是一个时间序列。
面板数据用双下标变量表示。例如
y
i t
, i = 1, 2, …, N; t = 1, 2, …, T
N 表示面板数据中含有 N 个个体。T 表示时间序列的最大长度。若固定 t 不变,y
i .
, ( i = 1,
2, …, N)是横截面上的 N 个随机变量;若固定 i 不变,y
. t
, (t = 1, 2, …, T)是纵剖面上的
一
个时
间序列(个体)。
例如 1990-2000 年 30 个省份的农业总产值数据。固定在某一年份上,它是由 30 个农业
总产总值数字组成的截面数据;固定在某一省份上,它是由 11 年农业总产值数据组成的
一
个
时间序列。面板数据由 30 个个体组成。共有 330 个观测值。
对于面板数据 y
i t
, i = 1, 2, …, N; t = 1, 2, …, T,如果从横截面上看,每个变量都有观测值,
从纵剖面上看,每一期都有观测值,或者每个个体的观测值个数是相同的,则称此面板数据
为平衡面板数据(balanced panel data)。若在面板数据中缺失若干个观测值,则称此面板数据
为非平衡面板数据(unbalanced panel data)。
例 1:1996-2002 年中国东北、华北、华东 15 个省级地区的居民家庭人均消费(不变价格)
和人均收入数据见表 1 和表 2。数据是 7 年的,每一年都有 15 个数据,共 105 组观测值。
人均消费和收入两个面板数据都是平衡面板数据,各有 15 个个体。人均消费和收入的面
板数据从纵剖面观察分别见图 2 和图 3。从横截面观察分别见图 4 和图 5。横截面数据散点
图的表现与观测值顺序有关。图 4 和图 5 中人均消费和收入观测值顺序是按地区名的汉语拼
音字母顺序排序的。
表 1 1999-2002 年中国东北、华北、华东 15 个省级地区的居民家庭人均消费数据(不变价格)
地区人均消费
1996
1997
1998
1999
2000
2001
2002
CP-AH(安徽)
3282.466
3646.150
3777.410
3989.581
4203.555
4495.174
4784.364
CP-BJ(北京)
5133.978
6203.048
6807.451
7453.757
8206.271
8654.433
10473.12
CP-FJ(福建)
4011.775
4853.441
5197.041
5314.521
5522.762
6094.336
6665.005
CP-HB(河北)
3197.339
3868.319
3896.778
4104.281
4361.555
4457.463
5120.485
CP-HLJ(黑龙江)
2904.687
3077.989
3289.990
3596.839
3890.580
4159.087
4493.535
CP-JL(吉林)
2833.321
3286.432
3477.560
3736.408
4077.961
4281.560
4998.874
CP-JS(江苏)
3712.260
4457.788
4918.944
5076.910
5317.862
5488.829
6091.331
CP-JX(江西)
2714.124
3136.873
3234.465
3531.775
3612.722
3914.080
4544.775
CP-LN(辽宁)
3237.275
3608.060
3918.167
4046.582
4360.420
4654.420
5402.063
CP-NMG(内蒙古)
2572.342
2901.722
3127.633
3475.942
3877.345
4170.596
4850.180
CP-SD(山东)
3440.684
3930.574
4168.974
4546.878
5011.976
5159.538
5635.770
CP-SH(上海)
6193.333
6634.183
6866.410
8125.803
8651.893
9336.100
10411.94
CP-SX(山西)
2813.336
3131.629
3314.097
3507.008
3793.908
4131.273
4787.561
CP-TJ(天津)
4293.220
5047.672
5498.503
5916.613
6145.622
6904.368
7220.843
CP-ZJ(浙江)
5342.234
6002.082
6236.640
6600.749
6950.713
7968.327
8792.210
资料来源:《中国统计年鉴》1997-2003。
表 2 1999-2002 年中国东北、华北、华东 15 个省级地区的居民家庭人均收入数据(不变价格)
地区人均收入
1996
1997
1998
1999
2000
2001
2002
IP-AH(安徽)
4106.251
4540.247
4770.470
5178.528
5256.753
5640.597
6093.333
IP-BJ(北京)
6569.901
7419.905
8273.418
9127.992
9999.700
11229.66
12692.38
IP-FJ(福建)
4884.731
6040.944
6505.145
6922.109
7279.393
8422.573
9235.538
IP-HB(河北)
4148.282
4790.986
5167.317
5468.940
5678.195
5955.045
6747.152
IP-HLJ(黑龙江)
3518.497
3918.314
4251.494
4747.045
4997.843
5382.808
6143.565
IP-JL(吉林)
3549.935
4041.061
4240.565
4571.439
4878.296
5271.925
6291.618
IP-JS(江苏)
4744.547
5668.830
6054.175
6624.316
6793.437
7316.567
8243.589
IP-JX(江西)
3487.269
3991.490
4209.327
4787.606
5088.315
5533.688
6329.311
IP-LN(辽宁)
3899.194
4382.250
4649.789
4968.164
5363.153
5797.010
6597.088
IP-NMG(内蒙古)
3189.414
3774.804
4383.706
4780.090
5063.228
5502.873
6038.922
IP-SD(山东)
4461.934
5049.407
5412.555
5849.909
6477.016
6975.521
7668.036
IP-SH(上海)
7489.451
8209.037
8773.100
10770.09
11432.20
12883.46
13183.88
IP-SX(山西)
3431.594
3869.952
4156.927
4360.050
4546.785
5401.854
6335.732
IP-TJ(天津)
5474.963
6409.690
7146.271
7734.914
8173.193
8852.470
9375.060
IP-ZJ(浙江)
6446.515
7158.288
7860.341
8530.314
9187.287
10485.64
11822.00
资料来源:《中国统计年鉴》1997-2003。
2000
3000
4000
5000
6000
7000
8000
9000
10000
11000
1996 1997 1998 1999 2000 2001 2002
CPAH
CPBJ
CPFJ
CPHB
CPHLJ
CPJL
CPJS
CPJX
CPLN
CPNMG
CPSD
CPSH
CPSX
CPTJ
CPZJ
2000
4000
6000
8000
10000
12000
14000
1996 1997 1998 1999 2000 2001 2002
IPAH
IPBJ
IPFJ
IPHB
IPHLJ
IPJL
IPJS
IPJX
IPLN
IPNMG
IPSD
IPSH
IPSX
IPTJ
IPZJ
图 2 15 个省级地区的人均消费序列(纵剖面) 图 3 15 个省级地区的人均收入序列
图 4 15 个地区的人均消费散点图(7 个时期) 图 5 15 个地区的人均收入散点图(7 个时期)
(每条连线表示同一年度 15 个地区的消费值) (每条连线表示同一年度 15 个地区的收入值)
用 CP 表示消费,IP 表示收入。AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX,
TJ, ZJ 分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、
辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。
15 个地区 7 年人均消费对收入的面板数据散点图见图 6 和图 7。图 6 中每一种符号代表
一个省级地区的 7 个观测点组成的时间序列,相当于观察 15 个截面上两个变量的时间序列
数据的散点图。图 7 中每一种符号代表一个年度的截面散点图(共 7 个时期),相当于观察 7
个时期上两个变量的截面数据的散点图。
图 6 人均消费对收入的面板数据(15 个时间序列叠加)
2000
4000
6000
8000
10000
12000
14000
2 4 6 8 10 12 14
CP1996
CP1997
CP1998
CP1999
CP2000
CP2001
CP2002
2000
4000
6000
8000
10000
12000
14000
2 4 6 8 10 12 14
IP1996
IP1997
IP1998
IP1999
IP2000
IP2001
IP2002
图 7 人均消费对收入的面板数据(7 个时期叠加)
为了观察得更清楚一些,图 8 给出北京和内蒙古 1996-2002 年消费对收入散点图。从图
中可以看出,无论是从收入还是从消费看内蒙古的水平都低于北京市。内蒙古 2002 年的收入
与消费规模还不如北京市 1996 年的大。图 9 给出该 15 个省级地区 1996 和 2002 年的消费对
收入散点图。可见 6 年之后 15 个地区的消费和收入都有了相应的提高。
图 8 北京和内蒙古 1996-2002 年消费对收入时序图 图 9 1996 和 2002 年 15 个地区的消费对收入散点图
EViews 文件说明(dataeviews->panel_cons.wfl)
income_* :名义收入;consume_* :名义消费;ip_*:实际收入;cp_*:实际消费;p_*:价格指数。
操作方法:
建立工作文件(File)
→建立面板(Object)
→定义截面标示符(Define)
→定义变量名称(Sheet)
→拷贝数据(或通过 Import 导入数据)
练习题:
1. 利用 Consume.xls 建立 Eviews 工作文件
2. 观察不同截面的 cp(ip)的时间趋势图;
(如果是建立 pool,需要将 Stacked 文件按照时间将原文件拆分,即新文件的结构是截面数据)
3. 观察不同截面的 cp 和 ip 的散点图;
剩余49页未读,继续阅读
资源评论
猫一样的女子245
- 粉丝: 101
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功