没有合适的资源?快使用搜索试试~ 我知道了~
data_science_course_data_cleaning
共3个文件
md:1个
r:1个
pdf:1个
需积分: 5 0 下载量 61 浏览量
2021-06-28
23:41:33
上传
评论
收藏 41KB ZIP 举报
温馨提示
整理数据的自述文件 该数据来源于使用智能手机收集人类活动的分离数据集,其中 70% 为训练数据,30% 为测试数据。原始数据包含两个文件夹中的 sereral 文件,使用编程语言 R 处理生成一个文件。 首先,cbind() 用于将数据与测试和训练数据的活动和标识符结合起来。 然后,“subject”和“activivy”使用merge()命令将它们合并以生成一个名为“allData”的大文件。 使用 dplyr 包中的 select() 进一步提取仅包括每个测量值的平均值和标准推导的部分数据。 接下来,通过产生因子变量用描述性名称替换数字活动值。 列变量名称也被编辑为更具描述性的名称,包括分别用“时间”和“频率”替换“t”和“f”,删除“-”和“()”并修复“BodyBody”错误。 最终数据仅包括每个活动和主题的每个变量的平均值。
资源推荐
资源详情
资源评论
收起资源包目录
data_science_course_data_cleaning-master.zip (3个子文件)
data_science_course_data_cleaning-master
Readme.md 1KB
codebook.pdf 44KB
run_analysis.R 2KB
共 3 条
- 1
资源评论
柠小檬的雷诺
- 粉丝: 23
- 资源: 4597
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功