《数据挖掘概念与技术第三版(英文版)》是韩家炜教授所著的数据挖掘领域的重要教材。该书系统地介绍了数据挖掘的各个方面,包括基本概念、关键技术、数据预处理、数据仓库和在线分析处理(OLAP)、数据立方体技术、频繁模式、关联和相关性挖掘、高级模式挖掘以及分类等。 书籍的第1章“Introduction”提出了数据挖掘的重要性,并解释了为什么需要数据挖掘。它详细探讨了数据挖掘是什么,能够处理哪些类型的数据,以及数据挖掘能够挖掘出哪些类型的模式。此外,还介绍了用于数据挖掘的各种技术,目标应用的类型,以及数据挖掘过程中的主要问题。这些问题包括对数据挖掘需求的理解、数据预处理、数据挖掘算法的开发、模式评估、知识的解释与应用等。 第2章“Getting to Know Your Data”着重于数据理解和数据准备,介绍了数据对象和属性类型、数据的基本统计描述、数据可视化、数据相似性和不相似性的测量方法等。这些内容为理解数据特征和后续的数据挖掘打下基础。 第3章“Data Preprocessing”涉及数据预处理的各个方面,包括数据清洗、数据整合、数据规约、数据转换和数据离散化等。数据预处理是为了提高数据质量,为数据挖掘算法的运行做准备。这一章强调了数据预处理在数据挖掘流程中的重要性,因为原始数据往往含有噪声、缺失值、异常值等问题,这些问题都会对挖掘结果产生影响。 第4章“Data Warehousing and Online Analytical Processing”介绍了数据仓库的概念、建模、设计、使用和实现。数据仓库是用于存储大量历史数据的系统,目的是为了分析和决策支持,而OLAP则是一种用于快速查询和分析数据仓库的技术。这一章还探讨了通过属性导向归纳的数据泛化。 第5章“Data Cube Technology”专注于数据立方体技术,讨论了数据立方体的计算、各种数据立方体计算方法以及通过数据立方体技术处理高级查询。多维数据分析在数据立方体空间内进行,是数据挖掘中的一个重要方面。 第6章“Mining Frequent Patterns, Associations, and Correlations”引入了频繁模式挖掘的基本概念,包括频繁项集挖掘方法和模式评估方法。模式评估是指评估发现的模式是否有用和有趣。 第7章“Advanced Pattern Mining”提供了模式挖掘的地图,涵盖了在多级、多维空间中的模式挖掘,基于约束的频繁模式挖掘,高维数据和巨大模式的挖掘,以及压缩或近似模式的挖掘。此外,还讨论了模式探索和应用。 第8章“Classification”介绍了分类的基本概念,并详细探讨了决策树归纳、贝叶斯分类方法、基于规则的分类和模型评估与选择。分类是数据挖掘中的一种基本任务,旨在预测或分类数据实例属于哪个类别。 整本书为读者提供了一个关于数据挖掘领域全方位的视角,为研究生一年级的数据挖掘课程提供了坚实的理论基础和实用的实践指南。韩家炜教授作为该领域的权威,通过此书向读者传达了数据挖掘的深度和广度,以及其在实际应用中的重要价值。
剩余791页未读,继续阅读
- 粉丝: 222
- 资源: 5
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- GJB150A-2009军用装备实验室环境试验方法(共19份标准文件)
- 浩辰CAD看图王8.6.0最新版本下载,轻量化CAD看图软件,无需下载专业CAD软件,即可实现CAD看图、CAD图纸编辑、格式转换、三维览图等
- SW materials
- 英雄联盟评论数据集和停用词表
- 整合Springboot shiro jpa mysql 实现权限管理系统(附源码地址)
- 微信小游戏小鸟飞行游戏
- 20190313-100538-非对称电容在变压器油中10kv高压电作用下产生力的现象
- GB材料数据库(!请注意鉴别其中的材料参数并不是完全正确!)
- JAVA商城,支持小程序商城、 供应链商城 小程序商城 H5商城 app商城超全商城模式官网 支持小程序商城 H5商城 APP商城 PC商城
- springboot的在线商城系统设计与开发源码