没有合适的资源?快使用搜索试试~ 我知道了~
java8集合源码-VT_Fall18_CS4984-CS5984:CS4984/CS5984课程资源,Fall18,弗吉尼亚理...
共7个文件
json:2个
png:2个
scala:2个
需积分: 5 0 下载量 17 浏览量
2021-06-04
17:02:32
上传
评论
收藏 69KB ZIP 举报
温馨提示
java8集合源码使用 ArchiveSpark 处理 Web 存档 关于 ArchiveSpark 课程 CS4984/CS5984:大数据文本摘要,2018 年秋季,弗吉尼亚理工大学的补充信息。 您将了解的内容:Github、Docker、Zeppelin、ArchiveSpark、Spark。 描述 ArchiveSpark 作为 Web 存档数据提取项目管道中的第一个(不限于)组件。 在本教程中,您将学习为 ArchiveSpark 部署测试环境、在本地测试代码并在 DLRL 集群上执行代码。 您还将找到有关 Spark 编程和使用 Spark 进行 NLP 处理的更多信息。 问题和问题 如果您遇到任何问题或问题,请先查看相关文档。 更多问题,您可以在此 GitHub 页面中创建问题: 目录 档案火花 “一个 Apache Spark 框架,用于轻松处理、提取和派生档案集合。” - 赫尔格霍 在本课程中,我们将利用 ArchiveSpark 处理我们的网络档案馆藏。 我们可以通过多种方式利用 ArchiveSpark 的强大功能:内容提取、字数统计、聚类 (LDA) 等。 在以
资源推荐
资源详情
资源评论
收起资源包目录
VT_Fall18_CS4984-CS5984-master.zip (7个子文件)
VT_Fall18_CS4984-CS5984-master
sample_scripts
ArchiveSpark_HtmlText_extraction.scala 2KB
ArchiveSpark_sentence_extraction.scala 3KB
sample_notebooks
SampleCode_PySpark.json 166KB
ArchiveSpark_HtmlText_extraction.json 30KB
ReadMe.markdown 10KB
doc
img_2.png 5KB
img_1.png 25KB
共 7 条
- 1
资源评论
weixin_38587155
- 粉丝: 7
- 资源: 908
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功