没有合适的资源?快使用搜索试试~ 我知道了~
scc411-project:Hadoop项目的Python代码
共5个文件
py:3个
md:1个
ipynb:1个
需积分: 14 0 下载量 61 浏览量
2021-03-04
00:47:29
上传
评论
收藏 12KB ZIP 举报
温馨提示
SCC411大学项目 用于数据预处理和分析的Python代码 重现已清理,合并的数据集的步骤 创建文件夹“ Google-Data-411”和“预处理” 将所有群集跟踪数据集放置在“ Google-Data-411”中 将'pre-processing.ipynb'放置在'Pre-processing'文件夹中 运行“ pre-processing.ipynb”中的所有代码块 可以在“预处理”文件夹中的.csv文件中找到经过清洁,预处理的数据 还向存在taskIndex和jobID的数据集添加一个processID列(表示正在运行的唯一软件) Cleaner.py 适当地预处理文件(作业事件,任务事件,任务使用情况,机器事件) 用法示例“ python3 Cleaner.py --jobevents jobfile.csv”或“ python Cleaner.py --taskeve
资源推荐
资源详情
资源评论
收起资源包目录
scc411-project-main.zip (5个子文件)
scc411-project-main
AutomateHive.py 3KB
README.md 2KB
Cleaner.py 3KB
pre-processing.ipynb 52KB
HiveQuery.py 2KB
共 5 条
- 1
资源评论
leeloodeng
- 粉丝: 20
- 资源: 4699
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- c语言文件读写操作代码.pdf
- C/C++,图形学-朱莉娅分形集(Julia Fractal)的计算方法与源程序
- 基于paddle+flask实现的猪只识别计数python源码数据集+模型+使用说明(高分项目).zip
- C/C++,树算法-K叉树(k-dimensional-tree)的计算方法与源代码
- msql pre-test
- C/C++,树算法-最小K叉树的计算方法与源程序
- 焊点标注-B07焊点111111111111111111.zip
- C/C++,树算法-K叉树的修剪(删除)算法及其源程序
- QT6实战-QML与C++联合编程教程
- C/C++,图算法-使用K近邻算法查找未知点组的计算方法与源程序
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功