实验三数据集的基本处理
【实验目的】
1. 了解 R 中常用的数据管理方法,熟悉基本的操作过程。
2. 掌握新增数据属性列的方法。
3. 掌握清洗数据(包括处理缺失值、处理日期变量等)的方法。
4. 掌握选取变量、刪除变量等的方法。
5. 掌握整合数据的方法。
【实验内容与实现】
1.创建一个三行四列的矩阵 a,数据为 1-12,并使用交互式编辑器修改变量名;创建一
个数据框 x,并在数据框中添加 3 个新变量,分别为原数据的差、乘积和余数。
2.构建一个含有缺失值的数据框,(id=c(1,2,3,4),name=c("张三","李四","王五","赵六"),
math=c(70,89,NA,80),English=c(86,78,65,92),检测该数据框是否含有缺失值并删除包含缺失
值的行;创建一个字符串的日期值,为"10/27/2017", "02/25/2017", "01/14/2017", "07/18/2017",
"04/01/2017",分别使用 as.Date 函数、as.POSIXlt 函数、stiptime 函数转换为日期变量;使用
sort 函数对 score 的 Chinese 列进行从大到小排列,并且把缺失值放在最后。
3.构建一个数据框,a<-c(11,22,33,44,55,66,77,88,99)。并使用两种方法来选取变量;使
用 sample 函数实现放回随机抽样与不放回随机抽样。
评论0