stata面板数据回归步骤:
步骤一:导入数据
命令:
insheet using 文件路径
如:
insheet using C:STUDYpapertaxi.csv
请注意:表中不能有中文字符,否则会出现错误。面板数据中不能有空值,没有数据的位置请以0 代替。
也可直接将数据复制粘贴到stata 的data editor 中,如图:
步骤二:调整格式
首先请将代表样本的var1 重命名
命令:
rename var1样本名
例如:
rename var1 province
接下来将数据转化为面板数据的格式
命令:
reshape long var,i(样本名)
例如:
reshape long var,i(province)
其中var 代表的是所有的年份(var2,var3,var4……)
转化后的格式如图:
转化成功后继续重命名,其中_j在这里代表原始表中的年份,var 代表该变量的名称,命令如下:
rename _j yearrename var taxi
步骤三:排序
命令:sort 变量名
例如:
sort province year
意思为将province 按升序排列,然后再根据排好的province 数列排year 这一列,如图:
(虽然很多时候在执行sort 前数据就已经符合要求了,但以防万一请务必执行此操作)
最后,保存。
至此,一个变量的前期数据处理就完成了,请按照同样的方法处理所有的变量。在处理新变量前请使用命令:clear,将stata 重置。
这里为方便举例再处理一个名为so2 的变量。如图:
相关推荐:《常见问题》
步骤四:合并数据
任意打开一个处理过的变量的dta 文件作为基础表(推荐使用因变量的dta 文件,这里使用so2 作为因变量)
命令:merge 样本名 时间 using 文件路径
例如:
merge province year using C:STUDYpapertaxi.csv
意思是将taxi 的数据添加到so2 的数据表中,如图:
然后使用命令:
tab _merge
检验数据的差分,正常情况下_merge:3 一栏的percent 应该为100%,如图:
然后使用命令:drop _merge,将数据表中的_merge 一列去掉。
接着重新使用命令:sort样本名 时间
例如:sort province year为新生成的表排序。
如法炮制,将所有的变量都添加到基础表中,如图:
回归
首先,使用命令:xtset 样本名 时间,定义面板数据。
例如:
xtset province year
如图:
然后使用命令:
xtreg因变量 自变量进行回归分析
例如:
xtreg so2 taxi busload drivers roadlength
如图: