云南大学数学与统计学院
《数据挖掘与决策支持实验》上机实践报告
:运筹学数据挖掘与决策支持实验
:
级
:
:彭程
:刘鹏
信息与计算科学
:对机器生产数据进行特征选择
:
:
:01
:
一、实验目的
学习使用 R 语言进行变量选择。
二、实验内容
如下表:
表格 1 产品加工与产品良率
产品编号 加工时间
机台类型 加工时间
机台类型 良率
请将给定数据进行变量选择,从而实现维归约。要求使用一种基于熵度量的无监督特征选择方法减少
数据集的维度。
三、实验平台
Windows 10 Pro 1803;
Microsoft
©
Visual Studio 2017 Enterprise。
Version 1.1.442 – © 2009-2018 RStudio, Inc.
四、算法设计
数据预分析:如表格 1 产品加工与产品良率所示,表格中有四列自变量,一列因变量。其中,因为
每种产品都需要进行两个阶段的加工,所以有加工时间与对应的机台类型。可以观察到,加工时间是属于
有顺序关系的数值型数据,而机台类型是属于分类型数据。
评论0