#获取和清理数据 - 课程项目
此存储库包含 run_analysis.R,它是 Coursera 上获取和清理数据课程的课程项目所需的。
工作目录应设置为 UCI HAR 数据集。
run_analysis.R 包含两个函数:
清洁数据()
将训练和测试数据作为输入并将它们加载到一个大数据集中。
加载变量名,去掉重复的变量名,然后只从包含字符串“mean”和“std”的数据集中选择变量。
从测试和训练数据加载主题,绑定它们。
加载测试和训练活动,绑定它们并将它们与活动名称合并。
将主题和活动绑定到原始数据框。
正确格式化所有变量名称,使其更易于阅读和引用。
按主题 ID (SUB_ID) 和活动 ID (ACT_ID) 对数据集进行分组。
返回数据集。
汇总数据()
将 clean_data() 输出作为输入。
按主题和活动汇总数据,并计算来自 UCI H