没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论









回归分析完整
步骤 吐 血 推 荐
------------------------------------------作者 xxxx
------------------------------------------日期 xxxx

【精品文档】
stata 回归分析完整步骤——吐血推荐
下载连乘函数 方法为
对公司和日期排序
为实际公司的股票收益率
为公司的预期股票收益率
! 求每个公司事件日的累计复合收益率
" ! 求每个公司事件日的累计预期的复合收
益率
"
#$(清空内存中的数据)
#$$(关闭所有打开的日志文件)
%(设置用于 使用的内存容量)
&(关闭 选项。如果打开该选项,那么结果分屏输出,即一
次只输出一屏结果。你按空格键后再输出下一屏,直到全部输完。如果关闭则
中间不停,一次全部输出。)
'"((((设置矩阵的最大阶数。我用的是不是太大了?)
)(进入数据所在的盘符和文件夹。和 的命令行很相似。)
$#(文件名)*$$(打开日志文件,并更新。日志文件将记
录下所有文件运行后给出的结果,如果你修改了文件内容,$ 选项可以
将其更新为最近运行的结果。)
#(文件名)$(打开数据文件。)
(文件内容)
$$(关闭日志文件。)
+$(退出并清空内存中的数据。)
假设你清楚地知道所需的变量,现在要做的是检查数据、生成必要的数据并形
成数据库供将来使用。检查数据的重要命令包括 !,#,, 和
$。其中,! 提供的信息最全面,缺点是不能使用 , 条件限制范围,
所以,有时还要用别的帮帮忙。# 空格加变量名报告相应变量的非缺失的观察
个数,均值,标准差,最小值和最大值。 空格后面加一个(或两个)变量名
是报告某个变量(或两个变量二维)的取值(不含缺失值)的频数,比率和按
大小排列的累积比率。 后面可以加任意个变量名,只要数据中有。它报告
变量的存储的类型,显示的格式和标签。标签中一般记录这个变量的定义和单
位。$ 报告变量的观察值,可以用 , 或 来限制范围。所有这些命令都可以
【精品文档】

【精品文档】
后面不加任何变量名,报告的结果是正在使用的数据库中的所有变量的相应信
息。说起来苍白无力,打开 亲自实验一下吧。
顺带说点儿题外话。除了 ! 之外,上述统计类的命令都属于 族命令
(又称一般命令)。执行后都可以使用 #$ 报告储存在 ()中的统计
结果。最典型的 族命令当属 #'。它会把样本量、均值、标准差、方
差、最小值、最大值、总和等统计信息储存起来。你在执行 # 之后,只需敲入
#$ 就可以得到所有这些信息。其实,和一般命令的 # 命令类似,
估计命令(又称 族命令)也有 # 命令,具有报告,储存信息的功能。
在更复杂的编程中,比如对回归分解,计算一些程序中无法直接计算的统计量,
这些功能更是必不可少。
检查数据时,先用 ! 看一下它的值域和单位。如果有-,-- 这样的
取值,查一下问卷中对缺失值的记录方法。确定它们是缺失值后,改为用点记
录。命令是 $变量名 *,变量名 -。再看一下用点记录的缺失
值有多少,作为选用变量的一个依据。
得到可用的数据后,我会给没有标签的变量加上注解。或者统一标签;或者统
一变量的命名规则。更改变量名的命令是 (原变量名)空格(新变量名)。
定义标签的命令是 $!$.(变量名)空格”(标签内容)”。整齐划一的变量
名有助于记忆,简明的标签有助于明确变量的单位等信息。
如果你需要使用通过原始变量派生出的新变量,那么就需要了解 ,
和 $ 这三个命令。 和 $ 常常在一起使用。它们的基本语法是
或 $ 空格(变量名)=(表达式)。二者的不同之处在于 是
生成新变量,$ 是重新定义旧变量。
虚拟变量是我们常常需要用到的一类派生变量。如果你需要生成的虚拟变量个
数不多,可以有两种方法生成。一种是简明方法: 空格(变量名)=
((限制条件))/这外面的小括弧是命令需要的,里面的小括弧不是命令需要
的,只是说明“限制条件”并非命令0。如果某个观察满足限制条件,那么它的这
个虚拟变量取值为 ,否则为 (。另一种要麻烦一点。就是
(变量名)=,(取值为一限制条件)
$(相同的变量名)=(,(取值为零的限制条件)
两个方法貌似一样,但有一个小小的区别。如果限制条件中使用的变量都没有
任何缺失值,那么两种方法的结果一样。如果有缺失值,第一种方法会把是缺
失值的观察的虚拟变量都定义为 (。而第二种方法可以将虚拟变量的取值分为
三种,一是等于 ,二是等于 (,三是等于缺失值。这样就避免了把本来信息
不明的观察错误地纳入到回归中去。下次再讲如何方便地生成成百上千个虚拟
变量。
大量的虚拟变量往往是根据某个已知变量的取值生成的。比如,在某个回归中
希望控制每个观察所在的社区,即希望控制标记社区的虚拟变量。社区数目可
能有成百上千个,如果用上次的所说的方法生成就需要重复成百上千次,这也
太笨了。大量生成虚拟变量的命令如下;
(变量名)(变量名)
【精品文档】

【精品文档】
第一个括号里的变量名是已知的变量,在上面的例子中是社区编码。后一个括
号里的变量名是新生成的虚拟变量的共同前缀,后面跟数字表示不同的虚拟变
量。如果我在这里填入 ,那么,上述命令就会新生成 ,,等等,直到所
有社区都有一个虚拟变量。
在回归中控制社区变量,只需简单地放入这些变量即可。一个麻烦是虚拟变量
太多,怎么简单地加入呢?一个办法是用省略符号,表示所有 字母开头的
变量,另一法是用破折号,1( 表示第一个到第 1( 个社区虚拟变量
(假设共有 1( 个社区)。
还有一种方法可以在回归中直接控制虚拟变量,而无需真的去生成这些虚拟变
量。使用命令 可以做到,它的语法是
(被解释变量) (解释变量)!!(变量名)
!! 选项后面的变量名和前面讲的命令中第一个变量名相同。在上面的例
子中即为社区编码。回归的结果和在 中直接加入相应的虚拟变量相同。
生成变量的最后一招是 。 和 都用于生成新变量,但 的特
点是它更强大的函数功能。 可以支持一些函数, 支持额外的函数。
如果用 搞不定,就得用 想办法了。不过我比较懒,到现在为止只用
用取平均、加和这些简单的函数。
有的时候数据情况复杂一些,往往生成所需变量不是非常直接,就需要多几个
过程。曾经碰到原始数据中记录日期有些怪异的格式。比如,-- 年 ( 月
日被记录为 --(。我想使用它年份和月份,并生成虚拟变量。下面
是我的做法:
(((( ((
假设你已经生成了所有需要的变量,现在最重要的就是保存好你的工作。使用
的命令是 . 空格(文件名),$。和前面介绍的一样,$ 选项
将更新你对数据库的修改,所以一定要小心使用。最好另存一个新的数据库,
如果把原始库改了又变不回去,就叫天不应叫地不灵了。
前面说的都是对单个数据库的简单操作,但有时我们需要改变数据的结构,或
者抽取来自不同数据库的信息,因此需要更方便的命令。这一类命令中我用过
的有:改变数据的纵横结构的命令 2,生成退化的数据库 $$,合
并数据库的命令 和 。
纵列($#$)数据通常包括同一个行为者()在不同时期的观
察,所以处理这类数据常常需要把数据库从宽表变成长表,或者相反。所谓宽
表是以每个行为者为一个观察,不同时期的变量都记录在这个观察下,例如,
行为者是厂商,时期有 (((、(( 年,变量是雇佣人数和所在城市,假设雇
佣人数在不同时期不同,所在城市则不变。宽表记录的格式是每个厂商是一个
观察,没有时期变量,雇佣人数有两个变量,分别记录 ((( 年和 (( 年的
人数,所在城市只有一个变量。所谓长表是行为者和时期共同定义观察,在上
【精品文档】

【精品文档】
面的例子中,每个厂商有两个观察,有时期变量,雇佣人数和所在城市都只有
一个,它们和时期变量共同定义相应时期的变量取值。
在上面的例子下,把宽表变成长表的命令格式如下:
2$(雇佣人数的变量名)(标记厂商的变量名) 3(标记时期
的变量名)
因为所在城市不随时期变化,所以在转换格式时不用放在 2
$ 后面,转换前后也不改变什么。相反地,如果把长表变成宽表则使用如下
命令
24(雇佣人数的变量名)(标记厂商的变量名) 3(标记时
期的变量名)
唯一的区别是 $ 换成了 4。
$$ 的用处是计算某个数据库的一些统计量,再把它存为只含有这些统计
量的数据库。用到这个命令的机会不多,我使用它是因为它可以计算中位数和
从 到 -- 的百分位数,这些统计量在常规的数据描述命令中没有。如果要计
算中位数,其命令的语法如下
$$ (变量名) !(变量名)
生成的新数据库中记录了第一个括号中的变量(可以是多个变量)的中位数。
右面的 ! 选项是根据某个变量分组计算中位数,没有这个选项则计算全部样
本的中位数。
合并数据库有两种方式,一种是增加观察,另一种是增加变量。第一种用
,用在两个数据库的格式一样,但观察不一样,只需用 空格
# 空格(文件名)就可以狗尾续貂了。简单明了,不会有什么错。另一种
就不同了,需要格外小心。如果两个数据库中包含共同的观察,但是变量不同,
希望从一个数据库中提取一些变量到另一个数据库中用 。完整的命令如
下:
#
(文件名)
/打开辅助数据库0
(变量名)
/根据变量排序,这个变量是两个数据库共有的识别信息0
.(文件名)
$
/保存辅助数据库0
#
(文件名)
/打开主数据库0
(变量名)
【精品文档】
剩余41页未读,继续阅读
资源评论

- m0_577317342022-04-05用户下载后在一定时间内未进行评价,系统默认好评。
goodbyeone12
- 粉丝: 0
- 资源: 6万+

下载权益

C知道特权

VIP文章

课程特权

开通VIP

上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助

会员权益专享
安全验证
文档复制为VIP权益,开通VIP直接复制
