没有合适的资源?快使用搜索试试~ 我知道了~
mrmlf:用于 hadoop MapReduce (v2) 的 MultilineInputFormat (MLF)
共12个文件
java:6个
xml:2个
gitignore:1个
需积分: 9 0 下载量 121 浏览量
2021-06-29
22:40:33
上传
评论
收藏 14KB ZIP 举报
温馨提示
关于mrmlf 该库提供了一个扩展输入格式,即MultilineInputFormat基于HadoopMapReduce的新接口。 如何使用 您可以在上找到最新版本,并通过在pom.xml添加依赖项在您的项目中使用此库: <dependency> <groupId>cn.edu.sjtu.omnilab</groupId> <artifactId>mrmlf</artifactId> <version>0.1.2</version> </dependency> 数据目标 基本上,Hadoop 中的默认输入格式基于特定于行的文本文件或分离器感知的二进制格式(例如,SequenceFile 或 avro 格式)。 现实世界中的一种重要数据格式是多行形式,其中一个集成记录被拆分为多个自然行(由\r或\n分隔)。 例如,说明程序中的音乐CD元数据: <CD> <TIT
资源推荐
资源详情
资源评论
收起资源包目录
mrmlf-master.zip (12个子文件)
mrmlf-master
maven-central-deploy.sh 700B
src
test
resources
XMLTest.xml 4KB
java
cn
edu
sjtu
omnilab
mrmlf
MultilineInputFormatSample.java 3KB
main
java
cn
edu
sjtu
omnilab
mrmlf
MultilineRecordReader.java 3KB
SplitableLocation.java 149B
MultilineInputFormat.java 8KB
TextArrayWritable.java 304B
package-info.java 143B
LICENSE 523B
README.md 3KB
pom.xml 6KB
.gitignore 222B
共 12 条
- 1
资源评论
weixin_42119358
- 粉丝: 29
- 资源: 4660
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功