获取和清理数据:课程项目
介绍
该存储库包含“获取和清理数据”课程的课程项目练习,是数据科学专业的一部分。
关于原始数据
包含特征的测试和训练数据集没有标记,可以在 x_test.txt 和 x_train.txt 中找到。 活动标签位于 y_test.txt 和 y_train.txt 文件中。 训练和测试科目存储在 subject_test.txt 和 subject_train.txt 文件中。
关于脚本和整洁的数据集
输入:
UCI HAR 数据集必须下载并解压到工作目录中的“Data”文件夹中
执行路径:
合并训练集和测试集以创建一个数据集。
仅提取每个测量值的平均值和标准偏差的测量值。
使用描述性活动名称来命名数据集中的活动
使用描述性变量名称适当地标记数据集。
根据步骤 4 中的数据集,创建第二个独立的 tidy 数据集,其中包含每个活动和每个主题的每个变量的平均值