数据分析实验报告 第一次试验报告 习题1.3 1建立数据集,定义变量并输入数据并保存。 2数据的描述,包括求均值、方差、中位数等统计量。 分析—描述统计—频率,选择如下: 输出: 统计量 全国居民 农村居民 城镇居民 N 有效 22 22 22 缺失 0 0 0 均值 1116.82 747.86 2336.41 中值 727.50 530.50 1499.50 方差 1031026.918 399673.838 4536136.444 百分位数 25 304.25 239.75 596.25 50 727.50 530.50 1499.50 75 1893.50 1197.00 4136.75 3画直方图,茎叶图,QQ图。(全国居民) 分析—描述统计—探索,选择如下: 输出: 全国居民 Stem-and-Leaf Plot Frequency Stem & Leaf 5.00 0 . 56788 2.00 1 . 03 1.00 1 . 7 1.00 2 . 3 3.00 2 . 689 1.00 3 . 1 Stem width: 1000 Each leaf: 1 case(s) 分析—描述统计—QQ图,选择如下: 数据分析实验报告全文共5页,当前为第1页。输出: 数据分析实验报告全文共5页,当前为第1页。 习题1.1 4数据正态性的检验:K—S检验,W检验 数据: 取显着性水平为0.05 分析—描述统计—探索,选择如下: (1)K—S检验 单样本 Kolmogorov-Smirnov 检验 身高 N 60 正态参数a,,b 均值 139.00 标准差 7.064 最极端差别 绝对值 .089 正 .045 负 -.089 Kolmogorov-Smirnov Z .686 渐近显着性(双侧) .735 a. 检验分布为正态分布。 b. 根据数据计算得到。 结果:p=0.735 大于0.05 接受原假设,即数据来自正太总体。 (2)W检验 正态性检验 Kolmogorov-Smirnova Shapiro-Wilk 统计量 df Sig. 统计量 df Sig. 身高 .089 60 .200* .972 60 .174 a. Lilliefors 显着水平修正 *. 这是真实显着水平的下限。 结果:在Shapiro-Wilk检验结果,p=0.174大于0.05 接受原假设,即数据来自正太总体。 习题1.5 5多维正态数据的统计量 数据分析实验报告全文共5页,当前为第2页。数据: 数据分析实验报告全文共5页,当前为第2页。 统计量 x1 x2 x3 x4 N 有效 21 21 21 21 缺失 0 0 0 0 均值 18.219 27.867 4.505 33.767 均值向量为: 项间协方差矩阵 x1 x2 x3 x4 x1 3.509 2.707 1.019 1.266 x2 2.707 3.559 1.139 1.289 x3 1.019 1.139 1.998 1.740 x4 1.266 1.289 1.740 4.032 相关性 x1 x2 x3 x4 x1 Pearson 相关性 1 .766** .385 .336 显着性(双侧) .000 .085 .136 N 21 21 21 21 x2 Pearson 相关性 .766** 1 .427 .340 显着性(双侧) .000 .054 .131 N 21 21 21 21 x3 Pearson 相关性 .385 .427 1 .613** 显着性(双侧) .085 .054 .003 N 21 21 21 21 x4 Pearson 相关性 .336 .340 .613** 1 显着性(双侧) .136 .131 .003 N 21 21 21 21 **. 在 .01 水平(双侧)上显着相关。 数据分析实验报告全文共5页,当前为第4页。数据分析实验报告全文共5页,当前为第3页。结果:x4与其他数据无相关性,其他三组数据线性相关 数据分析实验报告全文共5页,当前为第4页。 数据分析实验报告全文共5页,当前为第3页。 相关系数 x1 x2 x3 x4 Spearman 的 rho x1 相关系数 1.000 .790** .434* .431 Sig.(双侧) . .000 .049 .051 N 21 21 21 21 x2 相关系数 .790** 1.000 .511* .488* Sig.(双侧) .000 . .018 .025 N 21 21 21 21 x3 相关系数 .434* .511* 1.000 .691** Sig.(双侧) .049 .018 . .001 N 21 21 21 21 x4 相关系数 .431 .488* .6
- 粉丝: 167
- 资源: 3万+
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 论文(最终)_20240430235101.pdf
- 基于python编写的Keras深度学习框架开发,利用卷积神经网络CNN,快速识别图片并进行分类
- 最全空间计量实证方法(空间杜宾模型和检验以及结果解释文档).txt
- 5uonly.apk
- 蓝桥杯Python组的历年真题
- 2023-04-06-项目笔记 - 第一百十九阶段 - 4.4.2.117全局变量的作用域-117 -2024.04.30
- 2023-04-06-项目笔记 - 第一百十九阶段 - 4.4.2.117全局变量的作用域-117 -2024.04.30
- 前端开发技术实验报告:内含4四实验&实验报告
- Highlight Plus v20.0.1
- 林周瑜-论文.docx