将多个数据源中的数据结合起来存放在一个一致的数据存储中
主要方法包括: 数据立方体聚集,维归约,数据压缩,数值归约,离散化和概念分层等
1、 R 语言初步认识(掌握 R 程序运行环境)
2、 实验数据预处理。(掌握 R 语言中数据预处理的使用)
对给定的测试用例数据集,进行以下操作。
1)、加载程序,熟悉各按钮的功能。
2)、熟悉各函数的功能,运行程序,并对程序进行分析。
对餐饮销量数据进统计量分析,求销量数据均值、中位数、极差、标准差,变异系数
和四分位数间距。
对餐饮企业菜品的盈利贡献度(即菜品盈利帕累托分析),画出帕累托图。
3)数据预处理
缺省值的处理:用均值替换、回归查补和多重查补对缺省值进行处理
对连续属性离散化:用等频、等宽等方法对数据进行离散化处理
四、 实验步骤
1、 R 语言运行环境的安装配置和简单使用
(1) 安装 R语言
R 语言下载安装包,然后进行默认安装,然后安装 RStudio 工具
(2) R 语言控制台的使用