小陈统计

V1

2022/11/14阅读:116主题:默认主题

stata学习笔记

stata笔记

1.stata计数函数

***产生新变量var1,其值为ID的重复次数
 bysort ID: egen var1=count(ID)

2.stata去重

***删除ID重复的观测值,只保留不重复的观测值
 duplicates drop ID ,force

3.stata结果导出为doc

***安装asdoc
ssc install asdoc, replace

***例1,把tab结果输出为doc表格
asdoc tab var1

***例2 把reg结果输出为doc
asdoc reg var1 var2 var3

*** 以上输出结果会存储在你当前工作簿文件夹内。

4.结果(回归结果)的输出

*** 安装outreg2
ssc install outreg2,replace

*** 默认输出结果为txt,可以更改为doc。
*** 输出结果会用*表示p值
reg var1 var2
outreg2 using D:/111.doc

outreg2命令详解,见下链接https://zhuanlan.zhihu.com/p/98393452?from_voters_page=true

结果输出详解,见下链接

  1. https://zhuanlan.zhihu.com/p/93793601
  2. https://blog.csdn.net/arlionn/article/details/101321523
  3. https://zhuanlan.zhihu.com/p/101239205
  4. https://blog.csdn.net/arlionn/article/details/103855343

5. 描述性统计

summarize, detail 下的指标包括:均值(mean),百分位数(p),四个最小值和四个最大值(min,max),权数,方差(var),标准差(sd),偏度(skewness),峰度(kurtosis) tabstat是对sum指令的灵活替代。 对称分布,偏度值为0;正偏态,偏度值>0;负偏态,偏度值<0; 正态分布,峰度值为3;尖峰厚尾,峰度>3,宽峰轻尾,峰度<3。

*** 1.tabstat,展示设置的统计量如mean、p25等,可以用by
tabstat var1 stat(me sd N min max p25), by(var2)
*** 2.tabulate,展示非缺失值的频数分布表
tab var1
tab var1 var2 var3
tab var1 var2, chi
*** 3.概要描述 均值、标准差、最小最大值、N
sum var1
*** 4.详细描述 百分位数、中位数、均值、标准差、方差、偏度、峰度
sum var1, detail

6.名言

All knowledge is, in final analysis, history;

All sciences are, in the abstact, mathematics;

All judgements are, in their rationale, statistics.

在终极的分析中,一切知识都是历史;

在抽象的意义下,一切科学都是数学;

在理性的世界里,所有的判断都是统计学。

——C.R.Rao《统计与真理》

7. 结果输出

esttab 结合eststo使用 命令

***做三个回归
eststo: reg varY1 var1 var2 var3
eststo: reg varY2 var1 var2 var3
eststo: reg varY3 var1 var2 var3
*** 三个回归的结果输出为一个表,文件名称为myfile, 并输出SE和Adjust R方
esttab using myfile, se ar2

表如下

Y1 Y2 Y3
coe1 * (SE1) coe4 * (SE4) coe7 * (SE7)
coe2 * (SE2) coe5 * (SE5) coe8 * (SE8)
coe3 * (SE3) coe6 * (SE6) coe9 * (SE9)
R1 R2 R3

代码解释

esttab using myfile.csv, 
b(%5.3F) 
p(%6.4f) 
se(%5.2f) 
t
star(*0.1 **0.05 ***0.01) 
nostar
title(XXX) 
note(XXX) 
scalars( F R2)

*** 解释,csv格式输出;

  1. b表示系数,占5个字符,小数点保留3位;
  2. p表示p值输出,占6个字符,小数点保留4位(如果字符不够,前面用空格表示);
  3. se表示输出SE,五个字符,小数点保留2位
  4. t报告t值同上
  5. star表示用***表示显著性;
  6. nostar表示不想加星星
  7. titie:XXX
  8. note:如果上面规定了star,这里会另有注释
  9. scalar,其他想要的标量如F值,R2等

分类:

其他

标签:

其他

作者介绍

小陈统计
V1