SAS 数据挖掘技术的实现
一、智能型的数据挖掘集成工具:SAS/EM
作为智能型的数据挖掘集成工具,SAS/EM 的图形化界面、可视化操作可引导用户(即
使是数理统计经验不太多的用户)按 SEMMA 原则成功地进行数据挖掘,用户只要将数据
输入,经过 SAS/EM 运行,即可得到一些分析结果。有经验的专家还可通过修改数据调整
分析处理过程。
SAS/EM 可实现同数据仓库和数据集市、商务智能及报表工具的无缝集成,它内含完整
的数据获取工具、数据取样工具、数据筛选工具、数据变量转换工具、数据挖掘数据库、数
据挖掘过程以及数据挖掘评价工具。
二、基于传统统计算法的数据挖掘工具:SAS/INSIGHT、SAS/STAT 以及 SAS/ETS 等
SAS/INSIGHT 是一个可视化数据探索与分析工具,它将统计方法与交互式图形显示融
合在一起,为用户提供全新的使用统计分析方法的环境。用户用 SAS/INSIGHT 可以考察单
变量(或指标)的分布,显示多变量(或指标)数据,用回归分析、方差分析和广义线形模
型等方法去建立模型。由于所有的图形和分析都是动态的,用户可以通过 3D 旋转图形来探
索数据,并通过点击图形上的点来识别它们,方便快捷地增加或删除一些变量。用户还可以
发现数据中的规律性,快捷地建立模型,并分析各指标间的关系。
SAS/STAT 软件包中覆盖所有实用数理统计方法,提供多个过程进行不同类型模型与不
同特点数据的回归分析,具有多种形式模型化的选择方法,可处理多种复杂数据,并为多种
试验设计模型提供方差分析工具;它可处理一般线性模型和广义线性模型的专用过程,为主
成分分析、典型相关分析、判别分析和因子分析提供许多专用过程;此外,它含有多种聚类
准则的聚类分析方法,用户可利用 SAS/STAT 进行生存分析。
SAS/ETS 拥有丰富的计量经济学和时间序列分析方法,是研究复杂系统和进行预测的
有力工具。它提供方便的模型设定手段与多样的参数估计方法。
除此之外,SAS/OR 可提供全面的运筹学方法,SAS/QC 为全面质量管理提供一系列工
具,SAS/IML 提供功能强大的面向矩阵运算的编程语言。
在数据挖掘中使用哪种方法,用 SAS 软件包中什么方法来实现,主要取决于用户的数
据集的特征和要实现的目标。实际上,选择不是惟一的,用户不妨多试几种方法,从实践中
选出最适合自己的方法和软件。
除了使用 SAS 的开发工具以外,用户还可选择其他厂商的开发工具,将 SAS 提供的数
据挖掘功能通过界面集成起来,实现用户定制的数据挖掘应用。
三、产品应用范围
评论0