2021 年四川省公需科目数据挖掘答案
正确率 84%〔绿色答案正确性大,黄色答案表示我也是蒙的〕
1、(单项选择,4 分)
K-means 算法的缺点不包括?( ) A、K 必须是事先给定的 B、对于“噪声〞和孤立点数据是敏感的 C、选择初始聚类中心 D、可伸缩、高效
2、(单项选择,4 分)
对数据进展数据清理、集成、变换、规约是数据挖掘哪个步骤的任务?( ) A、噪声检测 B、分类和预测 C、数据预处理 D、频繁模式挖掘
3、(单项选择,4 分)
以下那个不属于分类算法?( ) A、KNN B、SVM C、朴素贝叶斯 D、K-MEANS
4、(单项选择,4 分)
以下哪些算法是分类算法?( ) A、C4.5 B、EM C、K-Mean D、DBSCAN
5、(单项选择,4 分)
以下哪个度量不属于数据中心趋势度描述?〔〕 A、A.均值 B、四分位数 C、中位数 D、众数
6、(单项选择,4 分)
当不知道数据所带标签时. 可以使用哪种技术促使带同类标签的数据与带其他标签的数据相别离?( ) A、分类 B、聚类 C、关联分析 D、隐马尔可夫链
7、(单项选择,4 分)
某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购置尿布,这种属于数据挖掘的哪类问题?( )
A、自然语言处理 B、聚类 C、分类 D、关联规那么发现
8、(单项选择,4 分)
以下哪项不属于知识发现的过程?( ) A、数据挖掘 B、知识可视化表达 C、数据清理 D、数据测试
9、(单项选择,4 分)
DBSCAN 算法最大的挑战是? ( ) A、确定评估指标 B、确定半径及 MINPTS C、确定聚类形状 D、确定聚类个数
10、(单项选择,4 分)
以下哪些陈述是不正确的? ( )
A、聚类可以作为异常检测 B、聚类可以发现数据内部构造 C、聚类可以作为其他任务的预处理 D、聚类是一种监视学习方法
11、(单项选择,4 分)
将原始数据进展集成、变换、维度规约、数值规约是在以下哪个步骤的任务?( )
A、频繁模式挖掘 B、数据流挖掘 C、分类和预测 D、数据预处理
12、(单项选择,4 分)
知识发现流程最核心的步骤是什么? ( ) A、知识表示 B、模式评估 C、数据预处理 D、数据挖掘
13、(单项选择,4 分)
机器学习中,下面哪些方法不可以防止分类中的过拟合问题?〔〕