20000150001000050000I1JISI1HEBI1JIXI1GUXI1GASI1HUBI1SHXI1SAXI1NIXI1ANHI1HANI1HENI1SHDI1SHHI1SICI1GUDI1HUNI1YUNI1FUJI1QIHI1LINI1BEJI1TIJI1NMGI1GUZI1ZEJI1HLJI1JIL 图2b 28个省级地区城镇居民人均收入箱图(file:5expend-zhang)
首先用混合数据把28个地区的数据混合在一起(非面板数据)分析分省城镇居民人均食品支出(food)与城镇居民人均收入(income)的关系,从而确定建立何种类型的模型最合理。28个省市自治区,21年共588组观测值。
5000food4000300020001000income0400080001200016000200000 图3 Food和income的混合数据散点图
首先通过散点图研究。food和income的混合数据散点图如图3(file:income-food)。显然变量food和income之间存在非线性关系和异方差,建立线性模型是不合理的。但,如果不看散点图,还误以为线性模型是一个很好的回归结果。
把income取成对数形式,尝试建立半对数模型。图4显示,建立半对数模型也不合理。
176
5000food4000300020001000log(income)6.57.07.58.08.59.09.510.006.0 图4 Food和log(income)的混合数据散点图
尝试建立全对数模型(见图5)。图5与图3、图4相比,异方差得到克服。但是可以看出,log(Food)和log(income)的关系仍然是非线性的。
进一步观察log(food)和log(log(income) )的散点图,如图6。log(Food)和log(log(income) )存在满意的线性关系,同时,不存在异方差。所以讨论建立面板数据模型时,应该建立关于log(Food)和log(log(income) ) 的面板数据模型。
9.08.58.07.57.06.56.0log(income)5.56.06.57.07.58.08.59.09.510.0log(food)9.08.58.07.57.06.56.0log(log(income))5.51.801.851.901.952.002.052.102.152.202.252.30log(food) 图5 log(Food)和log(income)的混合数据散点图 图6 log(Food)和log(log(income) )的散点图
首先用混合数据(非面板数据)估计模型。得回归结果如下,
logfood = - 5.8636 + 6.2072 log(logincome) (1) (-61.7) (137.3)
R2 = 0.97,DW=2.0, N?T= 588
本来总样本容量应该是N?T= 21?31 = 651,但西藏、新疆、重庆的数据有缺失。
图7 混合数据估计结果(file:income-food, eq01)
177
上式的导函数是
dlogfoodt1= 6.2072
dlogincometlogincome导函数不是常量,说明(1)式中人均食品支出对人均收入的弹性系数是随着城镇人均
收入的增加而减小。当城镇人均收入为666元时,也即log(666) = log(income) = 6.5时,依据上式计算,log(food)的弹性系数是0.955.。当城镇人均收入增长到13400元时,也即log(13400) = log(income) = 9.5时,log(food)对收入的弹性系数下降到0.653。城镇人均食品支出对人均收入的弹性系数随着人均收入的提高而递减。
用面板数据得混合估计结果如下。
图8 混合OLS估计结果(file:5expend-zhang)
logfood = - 5.8117 + 6.2072log(logincome) (2) (-61.7) (137.3)
R2 = 0.97,DW= 0.16,N?T= 28?21 = 588
(1)和(2)式的估计系数是完全相同的,只有DW值不同,(1)式的数据是全部按数值大小排列的,(2)式按每个个体时间序列排列的。 用个体固定效应回归模型的估计结果如下:
logfood = - 5.5151 + 6.0645 log(logincome) (3) (-90.1) (206.3)
R2 = 0.989,DW= 0.43,N?T= 28?21 = 588
178
图9 个体固定效应估计结果(删去了输出结果的中间部分,file:5expend-lishisen)
总样本容量是N?T= 28?21 = 588。
用F检验判断是建立混合回归模型合理,还是建立个体固定效应回归模型合理。
F=
(SSEr?SSEu)/N(8.2698?3.1509)/28=
SSEu/(NT?N?k)3.1509/(588?28?2)=
0.1828= 32.6
0.0056F0.05 (28, 558) = 1.6
因为F= 32.6 > F0.05 (31, 598) = 1.6,推翻原假设,比较上述两种模型,建立个体固定效应回归模型比混合回归模型更合理。
模型误差项存在自相关,通过尝试,加三个AR自回归项,得结果如下:
logfood = - 5.0160 + 5.8320 log(logincome) (4) (-35.1) (86.6)
R2 = 0.994,DW= 2.1,N?T-3N= 28?21-3?28 = 504
3个自回归项使自由度减小84个。
179