获取和清理数据:课程项目
介绍
该存储库包含我在Coursera课程“获取和清理数据”中的课程项目的工作,该课程是数据科学专业化的一部分。 首先是我对原始数据的注释。
关于原始数据
这些功能(其中561个)未标记,可以在x_test.txt中找到。 活动标签在y_test.txt文件中。 测试主题位于subject_test.txt文件中。
训练集也是如此。
关于脚本和整洁的数据集
我创建了一个名为run_analysis.R的脚本,它将测试集和训练集合并在一起(如Coursera的作业页面中所要求的)。 此脚本的先决条件:
必须提取UCI HAR数据集。
UCI HAR数据集必须在名为“ UCI HAR数据集”的目录中可用
合并测试和培训后,将添加标签,并且仅保留与均值和标准差有关的列。
最后,脚本将创建一个整齐的数据集,其中包含每个测试主题和每个活动的所有列的平均值。
该整洁
评论0
最新资源