首页 > 更多文库 > 1号文库 > 详情页

stata学习感想

2024-02-11 11:52:05

千文网小编为你整理了多篇相关的《stata学习感想》,但愿对你工作学习有帮助,当然你在千文网还可以找到更多《stata学习感想》。

stata11常用命令

注:JB统计量对应的p大于0.05,则表明非正态,这点跟sktest和swilk检验刚好相反; dta为数据文件; gph为图文件; do为程序文件;

注意stata要区别大小写; 不得用作用户变量名:

_all _n _N _skip _b _coef _cons _pi _pred _rc _weight double float long int in if using with 命令:

读入数据一种方式 input x y 1 4 2 5.5 3 6.2 4 7.7 5 8.5 end su/summarise/sum x 或 su/summarise/sum x,d 对分组的描述: sort group by group:su x %%%%% tabstat economy,stats(max)%返回变量economy的最大值

%%stats括号里可以是:mean,count(非缺失观测值个数),sum(总和),max,min,range,%% sd,var,cv(变易系数=标准差/均值),skewness,kurtosis,median,p1(1%分位

%% 数,类似地有p10, p25, p50, p75, p95, p99),iqr(interquantile range = p75 – p25)_all %描述全部

_N 数据库中观察值的总个数。_n 当前观察值的位置。_pi 圆周率π的数值。list gen/generate %产生数列 egen wagemax=max(wage)clear use by(分组变量)set more 1/0 count %计数

gsort +x(升序)gsort-x(降序)sort x 升序;并且其它变量顺序会跟着改变 label var y “消费” %添加标签 describe %描述数据文件的整体,包括观测总数,变量总数,生成日期,每个变量的存储类型(storage type),标签(label)replace x5=2*y if x!=3 %替换变量值

replace age = 25 in 107 %令第107个观测中age为25 rename y2 u %改变变量名

drop in 2 %删除全部变量的第2行

drop if x==.删去x为缺失值的所有记录

keep if x

keep x1-x5 %保留数据库中介于x1和x5间的所有变量(包括x1和x5),其余变量删除

ci x1 x2,by(group)%算出置信区间,不过先前对group要先排序,即sort group;

%by的意思逐个进行

cii 12 3.816667 0.2710343, level(90)%已知均值,方差,计算90%的置信区间

cii 10 2 %obs=10,mean=2,以二项分布形式,计算置信区间 centile x,centile(2.5 25 50 75 97.5)%取分位数 correlate/corr x y z %相关系数

pwcorr x y,sig %给出原假设r=0的命令 %如果变量非服从正态分布,则spearman x y regress/reg mean year %回归方程建立 reg y x,noconstant %无常数项 predict meanhat %预测拟合值 predict e,residual %得到残差 estat hettest % 异方差检验

dwstat % Durbin-Watson自相关检验 vif % 方差膨胀因子

logit y x1 x2 x3(y取0或1,是被解释变量,x1-x3是被解释变量)%logit回归

probit y x1 x2 x3(y取0或1,是被解释变量,x1-x3是被解释变量)%probit回归

tobit y x1 x2 x3(y取值在0和1之间,是被解释变量,x1-x3是被解释变量)%tobit回归

sktest e %残差正态性检验 p>0.05则接受原假设,即服从正态分布; %% sktest是基于变量的偏度和斜度(正态分布的偏度为0,斜度为3)swilk x %基于Shapiro-Wilk检验

%%p值越小,越倾向于拒绝零假设,也就是变量越有可能不服从正态分布 xi %生成虚拟变量 tabulat gender,summ(math)%用gender指标对math进行分类,返回两类math的mean、std、freq tabulate=tab %gen f=int((shengao-164)/3)*3+164 组距为3 tabulate 变量名 [, generate(新变量)missing nofreq nolabel plot ] %%%%% generate(新变量)// 按分组变量产生哑变量 nofreq // 不显示频数 nolabel // 不显示数值标记 plot // 显示各组频数图示 missing // 包含缺失值

cell // 显示各小组的构成比(小组之和为 1)column // 按栏显示各组之构成(各栏总计为 1)row // 按行显示各组之构成(各行总计为 1)%%%%% 求和,求最小? mod(x,y)%求余数

means %返回三种平均值 di normprob(1.96)di invnorm(0.05)di binomial(20,5,0.5)di invbinomial(20,5,0.5)di tprob(10,2)di invt(10.0.05)di fprob(3,27,1)di invfprob(3,27,0.05)di chi2(3,5)di invchi2(3,0.05)stack x y z,into(e)%把三列合成一列 xpose,clear %矩阵转置

append using d:

推荐专题: 自我评价学习上 学习态度自我评价 stata学习感想

相关推荐
本站文档由会员上传,版权归作者所有,如有侵权请发送邮件至89702570@qq.com联系本站删除。
Copyright © 2010 - 千文网移动版
冀ICP备2020027182号