13.1 数据挖掘概述
数据挖掘的过程
•
数据预处理阶段
数据准备:了解领域特点,确定用户需求
数据选取:从原始数据库中选取相关数据或样本
数据预处理:检查数据的完整性及一致性,消除噪声等
数据变换:通过投影或利用其他操作减少数据量
•
数据挖掘阶段
确定挖掘目标:确定要发现的知识类型
选择算法:根据确定的目标选择合适的数据挖掘算法
数据挖掘:运用所选算法,提取相关知识并以一定的方式表示
•
知识评估与表示阶段
模式评估:对在数据挖掘步骤中发现的模式 ( 知识 ) 进行评估
知识表示:使用可视化和知识表示相关技术,呈现所挖掘的知识