您好,登錄后才能下訂單哦!
常用的27個Stata命令
【1】直接導入csv格式數據
insheet using name.csv, clear
【2】修改變量長度
format var %20.2g
【3】刪除重復值
sort var1 var2
duplicatesdrop var1 var2, force
【4】數據合并
use data1, clear
merge m:m var1var2 using data2
drop if _merge==2
drop if _merge==1
drop _merge
【5】生成一期滯后項
tsset stkcd accper
gen newvarname=L.varname
【6】將文字轉化為數字變量
genBigN=0
replaceBigN=1 if strmatch(dadtunit,"普華永道*")
【7】刪除有缺失值的記錄
egen mis=rowmiss(_all)
drop if mis
drop mis
【8】行業劃分
clonevarsic2=ind
order stkcd accper sic2
replace sic2=substr(sic2,1,1) if substr(sic2,1,1)!=”C”
replace sic2=substr(sic2,1,2) if substr(sic2,1,1)==”C”
tabulate sic2 accper
【9】日期只保留年份
drop if substr( reptdt ,6,2)!="12"
replace reptdt=substr(reptdt,1,4)
gen accper=real(reptdt)
【10】數據分列
split date ,parse(-) destring ignor("-")
【11】求兩個日期之間的間隔天數
g td=date(trading_date,"YMD")
g ed=date(eventdate,"YMD")
form td ed %td
g d=ed-td
【12】生成行業、年份啞變量
tab year, gen(year)
tab industry, gen(industry)
【13】對數據進行Winsorize處理
findit winsor2
winsor2 varname, replace cut(1 99)
【14】描述性統計
tabstat var1var2, stat(n min mean median p25 p75 max sd),? if groupvar==0 or 1
logout, save(name) word replace: tabstat var, stat(n min mean p50 max sd) col(stat)f(%9.2g)
【15】兩變量列聯表
tabulate var1 var2, row chi2 taub gamma
【16】兩樣本間的均值T檢驗
ttest var, by(groupvar)
【17】兩樣本中位數Z檢驗
ranksum var, by(groupvar)
【18】Pearson/Spearman系數
spearmanx
n mata
x=st_data(.,"x")
c=correlation(x)
n=rows(c)
b=strofreal(lowertriangle(c)+uppertriangle(st_matrix("r(Rho)")),"%9.3f")
p=st_matrix("r(P)")
for (i=2; i<=n; i++) {
for (j=1; j<=i-1; j++) {
p[i,j]=2*ttail(rows(x)-2,abs(c[i,j]/sqrt((1-c[i,j]^2)/(rows(x)-2))))
b[i,j]=b[i,j]+(p[i,j]<0.01?"":(p[i,j]<0.05?"":(p[i,j]<0.1?"":"")))
b[j,i]=b[j,i]+(p[j,i]<0.01?"":(p[j,i]<0.05?"":(p[j,i]<0.1?"":"")))
}
}
c=editvalue(b, "2.000", "1")
c
end
直接導出結果
logout, save(pw) word replace:pwcorr_avars, star1(0.01) star5(0.05) star10(0.1)
【19】按年度按中位數分組
方法一
bysort year: egen g=xtile(var), n(2)
方法二
bys accper: cumul icindex, g(g) eq
levelsof accper, local(id)
display "`r(levels)'"
local cut1 = 1/2
foreach x of local id {
recode g (min/cut1'=0)(
cut1'/max=1) if accper==`x'
}
分三組
bys accper:cumul icindex, g(g) eq
levelsof accper, local(id)
display "`r(levels)'"
local cut1 = 1/3
local cut2 = 2/3
foreach x of local id {
recode g (min/cut1'=1)(
cut1'/cut2'=2)(
cut2'/max=3)if accper==`x'
}
【20】輸出回歸結果
安裝
ssc install estout, replace
單個回歸
reg
esttab using name.rtf, compress nogap r2 ar2 star( 0.1 0.05 0.01)
多個回歸一起
reg
est store m1
reg
est store m2
esttab m1 m2 using name.rtf, compress nogap r2 ar2 star( 0.1 0.05 0.01)
連續運行tobit模型結果導出:
esttab m1 m2, b(%9.4f) t scalars(N ll Fchi2 type), using name.rtf, compress nogap
連續運行OLS模型結果導出:
esttab m1m2, b(%9.4f) tscalars(N r2 F p), using name.rtf, compress nogap
【21】異方差檢驗及處理
檢驗:懷特檢驗
ssc install whitetst
reg
estat imtest, white
處理:“OLS+穩健標準差”
reg y x1 x2 x3, robust
【22】DW檢驗(序列相關性一階)
gen id=_n
tsset id
estat dwatson
【23】多重共線性
reg y x1 x2 x3
vif
【24】是否遺漏高次項
例如,檢驗y對x的線性回歸有沒有遺漏高次項
reg y x
estat ovtest
或者estat ovtest, rhs
【25】逐步回歸
stepwise, pe(0.1): reg y x
【26】Maddala(1983)兩階段處理效應模型
treatreg yx1-xn, tr(z=w1-wm)two
【27】Justified Jones Model
statsby _b, by(ind accper)saving(*.dta,replace):reg yx, noconstant
merge m:m indaccper using *.dta
gen yhat=y-_b*x
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。