您好,感谢您评估我的解决方案。
请在同一文件夹中找到 run_analysis.R。 您会发现许多评论指出了以下片段的原始要求。 脚本比较简单。 第一步,我们从文件中读取测试和训练数据表。 在第二步中,我们从 feature.txt 文件中读取所有特征,并为每个具有有趣变量的特征创建一个值为 TRUE 的布尔向量。 由于我们应该只关注均值和标准差,因此我使用 grepl 来过滤名称中带有 std() 或 mean() 的特征。 下一步中的这个向量对于从我们刚刚从文件中读取的其他大表中过滤不必要的列至关重要。 一旦从不必要的特征中清除了表格,我就会使用 rbind 将它们组合起来。 最后,我使用之前创建的 bool 向量和从 features.txt 读取的特征创建了一个列名向量。 数据集使用 setNames 获取列名。 使用 colMeans 计算最终数据集(用于提交)。
谢谢!