PROC FREQ 程序 采用的文件是一个样本 一个或多个类别变量 画次数分配表或列联表 (Contingency Tables) 算出几种 (检定的) 统计值 如 2 检定 费契尔的精确性测试 (Fisher's Exact Test) 相关系数 若读者指定执行分等简单的随机抽样 (Stratified Simple Random Sampling) 则 FREQ 程序可算出 CMH 统计值 (Cochran-Mantel-Haenszel) ### SAS教材(三):PROC FREQ 程序详解 #### 14.1 两种分析类别数据的程序 本章重点介绍了SAS系统中用于处理类别数据的两大统计程序——`PROC FREQ`与`PROC CATMOD`。这里我们将主要探讨`PROC FREQ`的功能及其应用场景。 #### 14.2 名词解释 - **类别变量**:类别变量是指那些产生非连续数值的变量,例如性别、国籍等。这些变量通常被分为几个不同的类别。 - **类别数据**:指基于一个或多个类别变量所获得的数据。当数据仅涉及一个类别变量时,可以绘制次数分配表;当涉及两个或多个类别变量时,则可形成列联表(Contingency Table)。 #### 14.3 简单的随机抽样 在简单的随机抽样中,每个个体都有相等的机会被选中作为样本。例如,在了解特定群体对某种事物的态度时,可以从该群体中随机选取一定数量的样本进行调查。下面通过一个具体的例子来说明这一过程: **案例分析**: 假设我们要研究北京市居民对于不同菜系的偏好程度,我们从北京市的电话簿中随机选取了200个电话号码进行调查,调查结果如下: - 北方菜:30人,占比15% - 粤菜:60人,占比30% - 湘菜:20人,占比10% - 川菜:80人,占比40% - 西餐:10人,占比5% 从数据可以看出,川菜最受欢迎,其次是粤菜,再次是北方菜,湘菜排在第四位,西餐最不受青睐。 #### 14.4 分等的简单随机抽样 分等简单的随机抽样(Stratified Simple Random Sampling)是一种更复杂的抽样方式,它先将总体按照某个或某些特征分层,然后再从每一层中随机抽取样本。这种方式能够确保样本在各个层面都具有代表性。 **应用场景**: 如果要研究不同性别对中国传统节日的态度,可以先将总体按性别分为男性和女性两层,然后从每层中随机抽取样本。 #### 14.5 整个母群的观察与分析 当研究目标是对整个群体进行分析时,就需要收集整个群体的数据。这种情况下,不再进行抽样,而是直接对所有个体进行观测。 **案例分析**: 例如,要分析某公司员工的满意度情况,可以直接向所有员工发放问卷,而不是只抽取一部分员工作为样本。 #### 14.6 采用随机分派的实验 在某些研究中,会采用随机分派的方式将参与者分成不同的组别,以便对比不同条件下的效果差异。这种方式常用于临床试验或者教育实验等场景。 **应用场景**: 例如,研究不同教学方法对学生学习成绩的影响时,可以随机将学生分到不同的班级,每个班级采用不同的教学方法,然后比较各班级的学习成绩。 #### 15.1 PROCFREQ程序概述 `PROC FREQ`主要用于处理类别数据,包括但不限于以下功能: - **次数分配表**:展示单一类别变量的分布情况。 - **列联表**:展示两个或多个类别变量之间的关联情况。 - **统计检验**:进行诸如卡方检验(χ² test)、费契尔的精确性测试(Fisher’s Exact Test)等统计检验,评估变量间的关联程度。 - **相关系数**:计算类别变量之间的相关性。 #### 15.2 如何撰写PROCFREQ程序 撰写`PROC FREQ`程序的基本步骤如下: 1. **指定数据集**:使用`PROC FREQ data=数据集名;`来指定要分析的数据集。 2. **定义变量**:使用`TABLES 变量名;`语句来定义要分析的类别变量。 3. **设置选项**:使用`/`符号后面跟选项来指定所需的具体分析操作,如`CHISQ`(进行卡方检验)。 **示例代码**: ```sas PROC FREQ data=样本数据; TABLES 性别 * 国籍 / CHISQ; RUN; ``` 此段代码用于分析“性别”与“国籍”之间的关联,并进行卡方检验。 #### 15.3 CMH统计值 当执行分等简单的随机抽样时,`PROC FREQ`还可以计算CMH(Cochran-Mantel-Haenszel)统计值,该统计值用于评估在控制其他变量的情况下,两个变量之间的关联程度。 **应用场景**: 例如,在研究吸烟与肺癌的关系时,可以控制年龄、性别等因素的影响,评估吸烟与肺癌之间的净关联。 通过以上介绍可以看出,`PROC FREQ`是处理类别数据的强大工具,不仅可以帮助用户快速理解数据分布特征,还能进行深入的统计检验,为数据分析提供有力支持。
剩余93页未读,继续阅读
- 粉丝: 1
- 资源: 3
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 熊猫精灵脚本助手V2.8
- 塑料粒子播撒机 非标自动化废料循环设备step全套技术资料100%好用.zip
- zemax单透镜1234567
- zemax消色差一天文望远物镜
- C语言编译器dev-C++
- 循环自动上料透明胶片折边机(sw19可编辑+工程图)全套技术资料100%好用.zip
- 显影辊抛光机(硒鼓OPC感光鼓表面抛光)sw18可编辑+工程图全套技术资料100%好用.zip
- 一出八螺丝供料器sw17可编辑全套技术资料100%好用.zip
- 樱桃去核机sw16可编辑全套技术资料100%好用.zip
- 移动印刷机(sw可编辑+工程图+BOM)全套技术资料100%好用.zip
- 程序员面试笔试面经基础教程
- 智能全自动煮面售卖机sw16可编辑全套技术资料100%好用.zip
- 秋招信息获取与分析基础教程
- Java编程世界探索基础教程
- 栈板自动拆垛机sw18可编辑全套技术资料100%好用.zip
- Python编程从入门到精通基础教程