获取和清理数据获取和清理数据课程项目
run_analysis.R的工作原理如下所述:
它将在工作目录中创建uci_har文件夹,并将下载的uci_har数据集zip文件放入其中,稍后将数据集解压缩。 使用rbind加载训练和测试数据集后,将两个数据集合并到一个数据框中。 然后,它根据要素数据集计算平均值和标准偏差。 清除列名称后,这些名称将应用于x数据框。 加载活动数据集后,它将使用tolower将其转换为小写,并使用gsub删除下划线。 活动和主题列名称是为y和subj数据集命名的。 x,y和subject这三个数据集被合并。 然后,将其作为txt文件导出到名为merged.txt的文件夹中。 活动和主题的平均值被创建到一个单独的整洁数据集中,该数据集另存为名为tidy_dataset_averages.txt的txt文件。