没有合适的资源?快使用搜索试试~ 我知道了~
《数据分析基础——基于Excel和SPSS》习题答案.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
96 浏览量
2022-07-07
01:03:25
上传
评论
收藏 491KB DOCX 举报
《数据分析基础——基于Excel和SPSS》习题答案.docx《数据分析基础——基于Excel和SPSS》习题答案.docx《数据分析基础——基于Excel和SPSS》习题答案.docx《数据分析基础——基于Excel和SPSS》习题答案.docx《数据分析基础——基于Excel和SPSS》习题答案.docx《数据分析基础——基于Excel和SPSS》习题答案.docx《数据分析基础——基于Excel和SPSS》习题答案.docx《数据分析基础——基于Excel和SPSS》习题答案.docx《数据分析基础——基于Excel和SPSS》习题答案.docx
资源推荐
资源详情
资源评论










《数据分析基础——基于 Excel 和 SPSS》习题答案
项目 1 数据分析概述
1.单选题
(1)A
(2)C
(3)D
(3)×
(4)B
(5)B
2.判断题
(1)√
(2)√
(4)√
(5)×
3.简答题
(1)答:数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进
行分析,以求最大程度地开发数据资料的功能,发挥数据的作用。它是为了提取有用信息和
形成结论而对数据加以详细研究和概括总结的过程。
(2)答:数据分析过程通常分为 6 个步骤,即明确分析目的和内容、数据收集、数据
预处理、数据分析、数据展现和报告撰写。
(3)答:根据使用的工具和理论的难度,可将常用的数据分析方法分成4 类,即单纯的
数据加工方法、数理统计分析方法、数据挖掘方法和大数据分析方法。
① 单纯的数据加工方法。这种数据分析方法侧重于数据的加工和预处理,通常采用SQL
和 Excel 工具,最典型的代表就是描述性统计分析和相关分析。
② 数理统计分析方法包括方差分析、回归分析(一元线性回归)、因子分析等,一般使
用 SPSS 和 SAS 等分析工具就可以实现。
③ 数据挖掘是一种决策支持过程,其方法包括聚类分析、分类分析(决策树、神经网
络、贝叶斯分类方法、支持向量机)、关联规则、回归分析(多元线性回归和逻辑斯蒂回归)。
④ 基于大数据的数据分析方法的理论基础是数据挖掘和分布式计算原理。基于大数据
的数据分析方法可认为是分析工具不一样的数据挖掘分析方法,有的也加入了数理统计的思
想,它无法使用SPSS,SAS 等单机数据分析工具来完成,其分析工具一般都需要具备分布式
计算的能力。大数据分析常用的工具有Hadoop,Spark,Storm等。
(4)略。
项目 2 数据的搜集、整理与显示
1.单选题
(1)D
(2)A
(3)D
(4)D
(5)A
(6)B
1 / 18

2.判断题
(1)√
(2)√
(3)×
(4)×
(5)×
(6)√ (7)×
3.简答题
(1)答:① 按照随机原则进行:概率抽样调查按照随机原则抽选样本,即从总体中抽
取样本完全随机决定,不受主观因素的影响。
② 概率已知:总体中每一个单位都有一定的概率被抽中,这个概率是已知的或是可以
计算出来的。
③ 目的是推断总体:概率抽样调查的调查目的不是说明样本本身,而是根据样本资料
来推断总体的情况。
④ 误差范围可控:随机抽样的误差是可以计算的,误差范围是可以控制的,推断结果
是真实可信的。
(2)答:统计调查误差分为登记性误差和代表性误差。
登记性误差是指调查过程中各个有关环节错误登记事实造成的误差。由于登记性误差是
各种主观原因引起的,因此又叫人为误差。
代表性误差是指用部分单位的数值估计总体时,由于该部分单位对总体缺乏充分的代表
性,而使推断的总体数值同总体的实际数值之间发生的误差。
(3)答:在统计分组的基础上,将总体的所有单位按组进行归并排列,形成总体中各
个单位在各组间的分布称为次数分布或频数分布。频数分布的实质是把总体的全部单位按某
标志所分的组进行分配所形成的数列,所以又称为分布数列。
(4)答:从形式上看,统计表是由总标题、横栏标题、纵栏标题和指标指数值四部分
构成。此外,还有表外附加,即在表下增加了补充资料、注解、附记、资料来源、指标的计
算方法、填表单位、填表人员及填表日期等内容。
4.综合题
(1)答:
①
a.按组距为 100 元编制分布数列如表 2-1 所示。
表 2-1 组距为 100 元的分布数列
按工资金额分组(元)
2100 以下
频率(%)
1
2
3
2
2
3
3
4
6
2101~2200
2201~2300
2301~2400
2401~2500
2501~2600
2601~2700
2701~2800
2801~2900
6
4
4
6
6
8
12
2 / 18

2901~3000
3001~3100
3101~3200
3201~3300
3301~3400
3401~3500
3501~3600
3601~3700
3701~3800
3801~3900
3900 以上
4
5
2
4
2
1
2
2
0
1
1
8
4
2
4
4
0
2
2
b.按组距为 200 元编制分布数列如表 2-2 所示。
表 2-2 组距为 200 元的分布数列
工人人数(人)
按工资金额分组(元)
2200 以下
频率(%)
2201~2400
2401~2600
2601~2800
2801~3000
3001~3200
3201~3400
3401~3600
3601~3800
3800 以上
5
7
6
3
2
4
2
4
c.按组距为 300 元编制分布数列如表 2-3 所示。
表 2-3 组距为 300 元的分布数列
工人人数(人)
按工资金额分组(元)
2300 以下
频率(%)
2301~2600
2601~2900
2901~3200
3201~3500
3501~3800
3800 以上
4
2
4
3 / 18

综上,按组距为 200 元分组更为合适。
②
a.
表 2-4 组距为 300 元的工人工资分布
向上累计
人数(人) 频率(%) 人数(人) 频率(%)
人数(人)
频率(%)
2200 以下
2201~2400
2401~2600
2601~2800
2801~3000
3001~3200
3201~3400
3401~3600
3601~3800
3800 以上
合计
3
6
16
26
40
60
74
86
92
96
100
—
8
5
13
20
30
37
43
46
48
50
—
7
6
3
2
4
4
2
4
2
4
50
—
100
—
—
b.工人工资统计分布折线图
某工厂工人工资统计分布折线图
6
4
工人人数
2
0
4 / 18
剩余17页未读,继续阅读
资源评论

是原来的你吗
- 粉丝: 1988
- 资源: 1万+

上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助

会员权益专享
安全验证
文档复制为VIP权益,开通VIP直接复制
