获取和清理数据
run_analysis.R 文件从人类活动识别数据库中读取数据。 该数据库是根据 19-48 岁年龄段的 30 名志愿者的实验建立的。 每位志愿者在腰部佩戴三星 Galaxy S II 智能手机的情况下进行六项活动:走路、站立、躺下、上楼和下楼。 获得的数据集被随机分成两组,其中 70% 的志愿者被选择用于生成训练数据和 30% 的测试数据。
对于数据集中的每个记录,它提供:来自加速度计的三轴加速度(总加速度)和估计的身体加速度,来自陀螺仪的三轴角速度,具有时域和频域变量的 561 特征向量,其活动标签,标识符进行实验的对象。
提供了以下数据集:“features_info.txt”:显示有关在特征向量上使用的变量的信息,“features.txt”:所有特征的列表,“activity_labels.txt”:将类标签与其活动名称联系起来,“ train/X_trai