数据挖掘方法论SEMMA.pdf
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
SAS数据挖掘方法论SEMMA 数据挖掘方法论SEMMA是SAS推出的数据挖掘方法论,旨在指导数据挖掘过程中的每一个步骤。SEMMA方法论包括五个步骤:Sample、Explore、Modify、Model和Assess。 Sample ─ 数据取样 数据取样是数据挖掘的第一步骤。通过数据取样,可以从大量的企业数据中抽取一个与问题相关的样本数据子集,而不是使用全部企业数据。这样可以减少数据处理量,节省系统资源,并使数据更易于处理。在数据取样时,需要注意数据的质量问题,检查数据的完整性和有效性。 Explore ─ 数据特征探索、分析和预处理 数据特征探索、分析和预处理是数据挖掘的第二步骤。在这个步骤中,需要对数据进行探索、分析和预处理,以了解数据的特征和趋势。SAS提供了强大的工具,例如SAS/INSIGHT和SAS/SPECTRA VIEW,可以进行可视化的操作,显示数据的统计分析结果。通过数据特征探索和分析,可以发现数据中的规律和趋势,了解数据之间的相关性。 Modify ─ 问题明确化、数据调整和技术选择 问题明确化、数据调整和技术选择是数据挖掘的第三步骤。在这个步骤中,需要对问题进行明确化,了解问题的具体要求,并对数据进行调整和选择合适的技术。Gartner group强调指出,在数据挖掘的各个阶段中,数据挖掘的产品都要使所使用的数据和所将建立模型处于十分易于调整、修改和变动的状态,这才能保证数据挖掘有效。 Model ─ 模型的研发、知识的发现 模型的研发、知识的发现是数据挖掘的第四步骤。在这个步骤中,需要对数据进行模型的研发和知识的发现,了解数据中的规律和趋势,并对其进行分析和解释。 Assess ─ 模型和知识的综合解释和评价 模型和知识的综合解释和评价是数据挖掘的第五步骤。在这个步骤中,需要对模型和知识进行综合解释和评价,了解模型和知识的有效性和可靠性,并对其进行评价和改进。 SEMMA方法论为数据挖掘提供了一个系统的指导,指导数据挖掘的每一个步骤,确保数据挖掘的有效性和可靠性。
- 粉丝: 0
- 资源: 3万+
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助