机器学习期末复习题选择题库

preview
5星 · 超过95%的资源 需积分: 0 275 下载量 192 浏览量 更新于2022-12-09 22 收藏 62KB DOCX 举报
机器学习期末复习题选择题库 本资源摘要信息涵盖了机器学习、数据挖掘、数据分析、数据处理和展示等多个方面的知识点,旨在帮助学习者快速回顾和巩固相关知识。下面是对每个问题的解析和知识点总结: 1. 知识发现的过程中,不包括数据测试。知识发现是指从大量数据中挖掘出有价值的信息和知识的过程,包括数据清理、数据变换、数据挖掘、知识表示和知识评估等步骤。 2. 协同过滤算法是推荐系统中的一种常用算法,它通过分析用户的行为和偏好,找到相似用户,并将这些用户喜欢的项推荐给有相似兴趣的用户。该算法属于内容 기반 filtering。 3. 高维属性不是一种常见的属性类型。常见的属性类型包括标称属性、数值属性、序数属性等。高维属性更多地出现在数据挖掘和机器学习领域,它是指在高维空间中 représentation 的数据。 4. 标准差是描述数据散度的重要指标之一。数据散度是指数据的离散程度,常用的指标有标准差、方差、范围等。 5. 众数不属于数据中心趋势度描述。数据中心趋势度是指数据的集中趋势,常用的指标有均值、中位数、众数等。 6. 数据预处理是数据挖掘的重要步骤之一,包括数据清理、数据集成、数据变换和数据规约等任务。 7. SVM 不是聚类算法,SVM 是一种常用的监督学习算法,用于分类和回归任务。常见的聚类算法包括 K-Means、DBSCAN 等。 8. Jupyter Notebook 是 Anaconda 的一部分,提供了一个基于 Web 的交互式计算环境,可以编辑易于人们阅读的文档,用于展示数据分析的过程。 9. Jupyter Notebook 是可以编辑文档且展示数据分析过程的组件,它可以重现整个分析过程,并将说明文字、代码、图表、公式和结论都整合在一个文档中。 10. Matplotlib 是使用 Python 语言编写的,它是一个流行的数据可视化库,提供了大量的数据可视化工具和函数。 11. 数据仓库是用于存储和管理数据的系统,数据处理是指对数据进行清理、转换和整合等操作。 12. Jupyter Notebook 是基于 Web 的交互式计算环境,可以编辑易于人们阅读的文档,用于展示数据分析的过程。 13. map 不是 ndarray 对象的属性。ndarray 对象的属性包括 shape、dtype、ndim 等。 14. np.arange(1, 10, 3) 将生成一个从 1 到 10,步长为 3 的数组,即 array([1, 4, 7])。 15. ndarray 对象中元素的类型必须是相同的。ndarray 对象可以存储不同的数据类型,但是在同一个 ndarray 对象中,所有元素的类型必须相同。 16. size 属性表示数组元素的总个数,等于 shape 属性元组元素的乘积。 17. list() 函数不能创建一个 ndarray 对象,但可以将一个列表作为参数传入 array() 函数中创建一个 ndarray 对象。 18. list() 函数不能创建一个 ndarray 对象。ndarray 对象可以使用 array() 函数创建,也可以使用 ones() 函数创建元素值都为 1 的数组,或者使用 zeros() 函数创建元素值都是 0 的数组。
身份认证 购VIP最低享 7 折!
30元优惠券