网站推广.NET

网站推广.NET

stata面板数据回归步骤是什么

来源:互联网

stata面板数据回归步骤:

步骤一:导入数据

命令:

insheet using 文件路径

如:

insheet using C:STUDYpapertaxi.csv

请注意:表中不能有中文字符,否则会出现错误。面板数据中不能有空值,没有数据的位置请以0 代替。

也可直接将数据复制粘贴到stata 的data editor 中,如图:

步骤二:调整格式

首先请将代表样本的var1 重命名

命令:

rename var1样本名

例如:

rename var1 province

接下来将数据转化为面板数据的格式

命令:

reshape long var,i(样本名)

例如:

reshape long var,i(province)

其中var 代表的是所有的年份(var2,var3,var4……)

转化后的格式如图:

转化成功后继续重命名,其中_j在这里代表原始表中的年份,var 代表该变量的名称,命令如下:

rename _j yearrename var taxi

步骤三:排序

命令:sort 变量名

例如:

sort province year

意思为将province 按升序排列,然后再根据排好的province 数列排year 这一列,如图:

(虽然很多时候在执行sort 前数据就已经符合要求了,但以防万一请务必执行此操作)

最后,保存。

至此,一个变量的前期数据处理就完成了,请按照同样的方法处理所有的变量。在处理新变量前请使用命令:clear,将stata 重置。

这里为方便举例再处理一个名为so2 的变量。如图:

相关推荐:《常见问题》

步骤四:合并数据

任意打开一个处理过的变量的dta 文件作为基础表(推荐使用因变量的dta 文件,这里使用so2 作为因变量)

命令:merge 样本名 时间 using 文件路径

例如:

merge province year using C:STUDYpapertaxi.csv

意思是将taxi 的数据添加到so2 的数据表中,如图:

然后使用命令:

tab _merge

检验数据的差分,正常情况下_merge:3 一栏的percent 应该为100%,如图:

然后使用命令:drop _merge,将数据表中的_merge 一列去掉。

接着重新使用命令:sort样本名 时间

例如:sort province year为新生成的表排序。

如法炮制,将所有的变量都添加到基础表中,如图:

回归

首先,使用命令:xtset 样本名 时间,定义面板数据。

例如:

xtset province year

如图:

然后使用命令:

xtreg因变量 自变量进行回归分析

例如:

xtreg so2 taxi busload drivers roadlength

如图:

stata面板数据分析