没有合适的资源?快使用搜索试试~ 我知道了~
devsearch-concat:并行连接来自 devmine 的 repos
共15个文件
scala:6个
sbt:2个
xml:1个
需积分: 8 0 下载量 173 浏览量
2021-06-05
22:37:00
上传
评论
收藏 27KB ZIP 举报
温馨提示
devsearch-concat 连接来自 DevMine 源存储库的源文件。 hdfs 上的块大小至少为 64MB。 出于这个原因,如果我们想使用 spark 或 hadoop 的 MapReduce 运行一些大型计算,我们需要将小文件连接成更适合 hdfs 的大文件。 devsearch-concat 将遍历由 DevMine 的 crawld ( ) 提供的 GitHub 数据,并过滤掉所有不是文本或太大而无法成为人类可读代码的文件。 然后它将使用这些文件创建大小至少为 128MB 的 tarball。 devsearch-concat 假定目录结构如下: REPO_ROOT └── Language Folder └── Github User └── Repository 存储库可以是普通目录或 tar 档案。 生成的 tar 存档中的所有
资源推荐
资源详情
资源评论
收起资源包目录
devsearch-concat-master.zip (15个子文件)
devsearch-concat-master
.travis.yml 326B
update_scaladoc.sh 1KB
LICENSE 34KB
src
test
scala
devsearch
concat
actors
WorkerSpec.scala 736B
SystemSpec.scala 3KB
main
scala
devsearch
concat
actors
Worker.scala 4KB
Coordinator.scala 3KB
Utils.scala 6KB
Main.scala 3KB
build.sbt 2KB
.gitignore 203B
scalastyle-config.xml 6KB
project
plugins.sbt 252B
build.properties 132B
README.md 1KB
共 15 条
- 1
资源评论
香港键师傅
- 粉丝: 27
- 资源: 4647
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功