27個常用stata命令（2）

發布時間：2020-07-17 15:30:16 來源：網絡閱讀：1288 作者：wx5cd39eed450f1 欄目：大數據

常用的27個Stata命令

【1】直接導入csv格式數據

insheet using name.csv, clear

【2】修改變量長度

format var %20.2g

【3】刪除重復值

sort var1 var2

duplicatesdrop var1 var2, force

【4】數據合并

use data1, clear

merge m:m var1var2 using data2

drop if _merge==2

drop if _merge==1

drop _merge

【5】生成一期滯后項

tsset stkcd accper

gen newvarname=L.varname

【6】將文字轉化為數字變量

genBigN=0

replaceBigN=1 if strmatch(dadtunit,"普華永道*")

【7】刪除有缺失值的記錄

egen mis=rowmiss(_all)

drop if mis

drop mis

【8】行業劃分

clonevarsic2=ind

order stkcd accper sic2

replace sic2=substr(sic2,1,1) if substr(sic2,1,1)!=”C”

replace sic2=substr(sic2,1,2) if substr(sic2,1,1)==”C”

tabulate sic2 accper

【9】日期只保留年份

drop if substr( reptdt ,6,2)!="12"

replace reptdt=substr(reptdt,1,4)

gen accper=real(reptdt)

【10】數據分列

split date ,parse(-) destring ignor("-")

【11】求兩個日期之間的間隔天數

g td=date(trading_date,"YMD")

g ed=date(eventdate,"YMD")

form td ed %td

g d=ed-td

【12】生成行業、年份啞變量

tab year, gen(year)

tab industry, gen(industry)

【13】對數據進行Winsorize處理

findit winsor2

winsor2 varname, replace cut(1 99)

【14】描述性統計

tabstat var1var2, stat(n min mean median p25 p75 max sd),? if groupvar==0 or 1

logout, save(name) word replace: tabstat var, stat(n min mean p50 max sd) col(stat)f(%9.2g)

【15】兩變量列聯表

tabulate var1 var2, row chi2 taub gamma

【16】兩樣本間的均值T檢驗

ttest var, by(groupvar)

【17】兩樣本中位數Z檢驗

ranksum var, by(groupvar)

【18】Pearson/Spearman系數

spearmanx
n mata
x=st_data(.,"x")
c=correlation(x)
n=rows(c)
b=strofreal(lowertriangle(c)+uppertriangle(st_matrix("r(Rho)")),"%9.3f")
p=st_matrix("r(P)")
for (i=2; i<=n; i++) {
for (j=1; j<=i-1; j++) {
p[i,j]=2*ttail(rows(x)-2,abs(c[i,j]/sqrt((1-c[i,j]^2)/(rows(x)-2))))
b[i,j]=b[i,j]+(p[i,j]<0.01?"":(p[i,j]<0.05?"":(p[i,j]<0.1?"":"")))
b[j,i]=b[j,i]+(p[j,i]<0.01?"":(p[j,i]<0.05?"":(p[j,i]<0.1?"":"")))
}
}
c=editvalue(b, "2.000", "1")
c
end

直接導出結果

logout, save(pw) word replace:pwcorr_avars, star1(0.01) star5(0.05) star10(0.1)

【19】按年度按中位數分組

方法一

bysort year: egen g=xtile(var), n(2)

方法二

bys accper: cumul icindex, g(g) eq

levelsof accper, local(id)

display "`r(levels)'"

local cut1 = 1/2

foreach x of local id {

recode g (min/cut1'=0)(cut1'/max=1) if accper==`x'

}

分三組

bys accper:cumul icindex, g(g) eq

levelsof accper, local(id)

display "`r(levels)'"

local cut1 = 1/3

local cut2 = 2/3

foreach x of local id {

recode g (min/cut1'=1)(cut1'/cut2'=2)(cut2'/max=3)if accper==`x'

}

【20】輸出回歸結果

安裝

ssc install estout, replace

單個回歸

reg

esttab using name.rtf, compress nogap r2 ar2 star( 0.1 0.05 0.01)

多個回歸一起

reg

est store m1

reg

est store m2

esttab m1 m2 using name.rtf, compress nogap r2 ar2 star( 0.1 0.05 0.01)

連續運行tobit模型結果導出：

esttab m1 m2, b(%9.4f) t scalars(N ll Fchi2 type), using name.rtf, compress nogap

連續運行OLS模型結果導出：

esttab m1m2, b(%9.4f) tscalars(N r2 F p), using name.rtf, compress nogap

【21】異方差檢驗及處理

檢驗：懷特檢驗

ssc install whitetst

reg

estat imtest, white

處理：“OLS+穩健標準差”

reg y x1 x2 x3, robust

【22】DW檢驗（序列相關性一階）

gen id=_n

tsset id
estat dwatson

【23】多重共線性

reg y x1 x2 x3
vif

【24】是否遺漏高次項

例如，檢驗y對x的線性回歸有沒有遺漏高次項

reg y x

estat ovtest

或者estat ovtest, rhs

【25】逐步回歸

stepwise, pe(0.1): reg y x

【26】Maddala(1983)兩階段處理效應模型

treatreg yx1-xn, tr(z=w1-wm)two

【27】Justified Jones Model

statsby _b, by(ind accper)saving(*.dta,replace):reg yx, noconstant

merge m:m indaccper using *.dta

gen yhat=y-_b*x

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

27個常用stata命令（2）

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

27個常用stata命令（2）

猜你喜歡

最新資訊

相關推薦

相關標簽