获取和清理数据-CourseProject
即使问题很棘手,程序run_analysis.R还是简短易懂。 程序流程是线性的,并且具有以下步骤:
1.读取原始数据
读取read.table所需的8个txt文件
注意:“ activity_labels.txt”是用stringsAsFactors = F读取的。这使得稍后在程序中将数字转换为字符串更容易。
2.仅提取每次测量的平均值和标准偏差的测量值。
R函数grepl的简单任务
3.合并训练和测试集以创建一个数据集。
3.1首先将列与cbind合并
3.2合并行
4.适当地用描述性变量名标记数据集。
我用了 ”。” 建立R(和人类)友好名称,
困难部分。 我使用的方法可能比gsub简单得多。
5.使用描述性活动名称在数据集中命名活动
我使用了一种非常原始的方法。 但这行得通。
6.独立的整洁数据集,其中包含每个活动和每个主题的每