大规模并行数据集清洗 我的四年荣誉项目。 该项目采用了大规模并行规模的Matthew A. Pugh开发的决策算法。 这样做的目的是在Fish4Knowledge(F4K)数据集中删除大量误报鱼检测结果,而又不会丢失太多的True Positives。 内容 run______.py处理的每个阶段的mpi脚本。 f4klib.py包含提取和处理所需的功能。 f4klib2.py包含用于绘图和统计的可选功能。 old-processing-scripts\ -包含过时的mpi处理脚本。 old-scripts\ -包含用于解析数据的过时I / O处理脚本。 f4k notebook.ipynb主要实验笔记本。 ML.ipynb和GroundTruth.ipynb地面真相和机器学习实验。 SVM parameter find.ipynb支持向量机实验。 Job partit
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~