获取数据课程项目
概述
此存储库包含获取和清理数据课程项目的结果。
以下部分描述了课程项目脚本的工作原理,并提供了描述输出数据变量的代码手册。
脚本实现
run_analysis.R 的实现使用 dplyr 库和基本 R 功能来操作输入数据。
脚本做出的一个基本假设是数据不包含缺失值,并且测量、标签和主题文件中的记录数相互匹配。 这是使用 R 和源数据验证的
读取数据
使用read.table函数读取数据。 测量的列标签是通过过滤features.txt文件中包含mean()或std() 的所有列生成的。 其他替换将特征列名称规范化为 CamelCase 样式。
基于activity_labels.txt 的描述性标签被加入到每个加载的数据集。 从各自的文件中读取主题键并附加到数据集。
从测试数据集文件
测试/X_test.txt
测试/y_test.txt
测试/subjec