stata教学.docx_capturestata资源-CSDN文库

需积分: 10 176 浏览量 2019-11-15 10:08:06 上传评论收藏 21KB DOCX 举报

Stata 是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。它提供许许多多功能，包含线性混合模型、均衡重复反复及多项式普罗比模式。用Stata绘制的统计图形相当精美。本文是一篇stata的详细使用教学，欢迎下载使用。 Stata是一款强大的统计分析软件，尤其适用于数据管理、统计建模和图形制作。在进行数据处理时，Stata提供了丰富的命令来帮助用户高效地完成任务。以下是对Stata使用的一些关键知识点的详细说明： 1. **回归分析**：Stata支持多种回归模型，包括线性混合模型和多项式概率比例模型等。回归分析可以帮助我们理解变量间的关系，预测因变量的值，并进行假设检验。 2. **数据排序**：`sort`命令用于按照一个或多个变量对数据进行升序或降序排序，例如`sort stkcd date`对股票代码和日期进行排序。 3. **计算复合收益率**：`egen`命令可以用来创建新的变量，例如`egen r3=prod(r1),by(stkcd date)`计算每个公司事件日的累计复合收益率。 4. **数据清理**：`capture`命令用于捕获可能出现的错误，如`capture clear`用于清空内存中的数据，`capture log close`关闭所有日志文件。 5. **设置内存和矩阵大小**：`set mem 128m`设置Stata使用的内存大小，`set matsize 4000`设置矩阵的最大阶数。 6. **文件操作**：`cd`用于切换工作目录，`use`命令打开数据文件，`log using`打开或更新日志文件，`exit,clear`退出Stata并清除内存数据。 7. **数据检查**：`codebook`提供变量的详细信息，`su`计算变量的统计量，`ta`展示变量的频数分布，`des`显示变量的存储类型和标签，`list`显示变量的观察值。 8. **数据处理**：`gen`和`replace`用于创建或修改变量，`egen`可以执行群体操作，如计算累积产品。例如，`egen r1=prod(x),by(groupvar)`计算每个groupvar组内x的乘积。 9. **缺失值处理**：Stata中，`.`通常表示缺失值。可以用`replace`命令将特定值替换为缺失值，如`replace (变量名)=. if (变量名)==-9`将-9替换为缺失值。 10. **标签与变量命名**：`label var`定义变量标签，`ren`用于重命名变量。保持变量名一致性和标签的完整性可以提高数据分析的可读性。 11. **虚拟变量**：生成虚拟变量（哑变量）是统计分析中的常见操作，`gen`命令结合条件语句可以快速创建。例如，`gen dummy = (条件)`将满足条件的观测设为1，否则设为0。以上就是Stata在数据处理和回归分析方面的一些核心概念和常用命令。熟练掌握这些工具，将能有效地进行复杂的数据分析工作。在实际操作中，应结合具体需求灵活运用这些知识点，以实现高效的数据探索和建模。

资源推荐

资源详情

资源评论

stata ——回归分析完整步骤吐血推荐

****下载连乘函数 prod,方法为:findit dm71

sort stkcd date //对公司和日期排序

gen r1=1+r //r 为实际公司的股票收益率

gen r2=1+r_yq //r_yq 为公司的预期股票收益率

egen r3=prod(r1),by(stkcd date) //求每个公司事件日的累计复合收益率

egen r4=prod(r2),by(stkcd date) //求每个公司事件日的累计预期的复合收益率

gen r=r4-r3

capture clear （清空内存中的数据）

capture log close （关闭所有打开的日志文件）

set mem 128m （设置用于 stata 使用的内存容量）

set more off （关闭 more 选项。如果打开该选项，那么结果分屏输出，即一次只输出一屏

结果。你按空格键后再输出下一屏，直到全部输完。如果关闭则中间不停，一次全部输

出。）

set matsize 4000 （设置矩阵的最大阶数。我用的是不是太大了？）

cd D: （进入数据所在的盘符和文件夹。和 dos 的命令行很相似。）

log using （文件名）.log,replace （打开日志文件，并更新。日志文件将记录下所有文件

运行后给出的结果，如果你修改了文件内容，replace 选项可以将其更新为最近运行的结

果。）

use （文件名）,clear （打开数据文件。）

（文件内容）

log close （关闭日志文件。）

exit,clear （退出并清空内存中的数据。）

假设你清楚地知道所需的变量，现在要做的是检查数据、生成必要的数据并形成数据库供

将来使用。检查数据的重要命令包括 codebook，su，ta，des 和 list。其中，codebook 提

供的信息最全面，缺点是不能使用 if 条件限制范围，所以，有时还要用别的帮帮忙。su

空格加变量名报告相应变量的非缺失的观察个数，均值，标准差，最小值和最大值。ta

空格后面加一个（或两个）变量名是报告某个变量（或两个变量二维）的取值（不含缺失

值）的频数，比率和按大小排列的累积比率。des 后面可以加任意个变量名，只要数据中

有。它报告变量的存储的类型，显示的格式和标签。标签中一般记录这个变量的定义和单

位。list 报告变量的观察值，可以用 if 或 in 来限制范围。所有这些命令都可以后面不加任

何变量名，报告的结果是正在使用的数据库中的所有变量的相应信息。说起来苍白无

力，打开 stata 亲自实验一下吧。

顺带说点儿题外话。除了 codebook 之外，上述统计类的命令都属于 r 族命令（又称一般

命令）。执行后都可以使用 return list 报告储存在 r（）中的统计结果。最典型的 r 族命

令当属 summarize。它会把样本量、均值、标准差、方差、最小值、最大值、总和等统计

信息储存起来。你在执行 su 之后，只需敲入 return list 就可以得到所有这些信息。其

实，和一般命令的 return 命令类似，估计命令（又称 e 族命令）也有 ereturn 命令，具有

报告，储存信息的功能。在更复杂的编程中，比如对回归分解，计算一些程序中无法直接

计算的统计量，这些功能更是必不可少。

检查数据时，先用 codebook 看一下它的值域和单位。如果有-9，-99 这样的取值，查一

下问卷中对缺失值的记录方法。确定它们是缺失值后，改为用点记录。命令是 replace (变

量名)=. if (变量名)==-9。再看一下用点记录的缺失值有多少，作为选用变量的一个依据。

得到可用的数据后，我会给没有标签的变量加上注解。或者统一标签；或者统一变量的命

名规则。更改变量名的命令是 ren （原变量名）空格（新变量名）。定义标签的命令是

label var ” ”（变量名）空格（标签内容）。整齐划一的变量名有助于记忆，简明的标签有

助于明确变量的单位等信息。

如果你需要使用通过原始变量派生出的新变量，那么就需要了解 gen，egen 和 replace 这

三个命令。gen 和 replace 常常在一起使用。它们的基本语法是 gen (或 replace)空格（变

量名）＝（表达式）。二者的不同之处在于 gen 是生成新变量，replace 是重新定义旧变

量。

虚拟变量是我们常常需要用到的一类派生变量。如果你需要生成的虚拟变量个数不多，可

以有两种方法生成。一种是简明方法：gen 空格（变量名）＝（（限制条件））[这外面

“ ”的小括弧是命令需要的，里面的小括弧不是命令需要的，只是说明限制条件并非命

令]。如果某个观察满足限制条件，那么它的这个虚拟变量取值为 1，否则为 0。另一种要

麻烦一点。就是

gen （变量名）＝1 if （取值为一限制条件）

replace（相同的变量名）＝0 if （取值为零的限制条件）

两个方法貌似一样，但有一个小小的区别。如果限制条件中使用的变量都没有任何缺失

值，那么两种方法的结果一样。如果有缺失值，第一种方法会把是缺失值的观察的虚拟变

量都定义为 0。而第二种方法可以将虚拟变量的取值分为三种，一是等于 1，二是等于

0，三是等于缺失值。这样就避免了把本来信息不明的观察错误地纳入到回归中去。下次

再讲如何方便地生成成百上千个虚拟变量。

大量的虚拟变量往往是根据某个已知变量的取值生成的。比如，在某个回归中希望控制每

个观察所在的社区，即希望控制标记社区的虚拟变量。社区数目可能有成百上千个，如果

用上次的所说的方法生成就需要重复成百上千次，这也太笨了。大量生成虚拟变量的命令

如下；

ta （变量名）, gen(（变量名）)

第一个括号里的变量名是已知的变量，在上面的例子中是社区编码。后一个括号里的变量

名是新生成的虚拟变量的共同前缀，后面跟数字表示不同的虚拟变量。如果我在这里填入

d，那么，上述命令就会新生成 d1，d2，等等，直到所有社区都有一个虚拟变量。

剩余11页未读，继续阅读

评论收藏

内容反馈

怎么安静

粉丝: 0
资源: 1

stata教学.docx

stata教程.docx

Stata教程.pdf

stata笔记.docx

第1讲 Stata的学习背景与学习意义.docx

斯托克,沃森计量经济学第七章实证练习stata.docx

stata教程文字版。docx

斯托克,沃森计量经济学第十二章实证练习stata操作及答案.docx

斯托克,沃森计量经济学第十三章实证练习stata操作及答案.docx

斯托克,沃森计量经济学第四章实证练习stata操作及答案.docx

上海海洋大学计量经济学应用软件STATA命令集.docx

利用STATA创建空间权重矩阵及空间杜宾模型计算命令0001.docx

多重中介STATA代码.zip

实证Stata代码命令汇总 .docx

利用STATA创建空间权重矩阵及空间杜宾模型计算-命令.docx

Stata 14新功能介绍.docx

Stata空间相关检验详细步骤.docx

Stata12.0.zip

stata数据分析实例报告.docx

原创】stata介绍之outreg2logout从简单到基础涵盖描述相关回归从时间到面板.docx

stata做tobit回归的具体步骤.docx

原创】stata介绍之outreg2logout从简单到基础涵盖描述相关回归从时间到面板 (2).docx

Stata12.rar

Stata命令.do

stata 命令.do

用STATA做空间计量.docx

计量经济学及stata应用 8.自相关 8.5处理自相关的Stata命令.mp4

计量经济学及stata应用 4.一元线性回归 4.7一元回归的Stata实例.mp4

计量经济学及stata应用 10.工具变量法 10.9工具变量法的Stata实例.mp4

最新资源