run_analysis.R 的描述
随附的 R 脚本在较高级别上从 UCI HAR 数据集中获取一些数据,假设这些数据已解压缩到此目录中的文件夹中,并从中生成一个整洁的数据集。 以下是脚本执行的步骤:
合并训练集和测试集以创建一个数据集。 对于我们的分析,我们希望将所有数据一起考虑,因此脚本将测试集和训练集合并在一起。 为此,我使用了连接向量(使用 c())和“合并”操作的组合。
仅提取每个测量值的平均值和标准偏差的测量值。 原始数据集包含许多变量和每个变量的许多统计信息。 我们只对每个测量变量的均值和标准差感兴趣,因此我们排除了所有其他数据。 为了确定要保留哪些列,我使用了 grep 函数来确定哪些特征名称(从 features.txt 中提取)包含字符串“mean”或字符串“std”。 然后我使用这些索引对数据框进行子集化。
使用描述性活动名称来命名数据集中的活动 原始数据集包