没有合适的资源?快使用搜索试试~ 我知道了~
离线采集工具Sqoop文档.doc
需积分: 34 1 下载量 133 浏览量
2021-04-01
09:54:47
上传
评论
收藏 1000KB DOC 举报
温馨提示
试读
17页
离线采集工具Sqoop文档.doc
资源推荐
资源详情
资源评论
Sqoop 调研文档
.1 版本迭代
文档版本 撰写时间 撰写人 属性 审核人
调研文档
.2 Sqoop 简介
旨在协助 与 之间进行高效的大数据交流,是连接关系型数据库
和 的桥梁,主要有两个方面导入和导出,可以把关系型数据库的数据导入到
与其相关的系统如 和 中;同时也可以把数据从系统里抽取并
导出到关系型数据库里。
是一个在结构化数据和 之间进行批量数据迁移的工具,结构化数据可以
是 、 !"#$ 等 。 底 层 用 # 程 序 实 现 抽 取 、 转 换 、 加 载 ,
# 天生的特性保证了并行化和高容错率。
如果要用 ,必须正确安装并配置 ,因依赖于本地的 环境启动
程序; 、!"#$ 等数据库的 %& 驱动也要放到 的 $' 目录下。
.3 Sqoop 产生原因
大多数使用 技术的处理大数据业务的企业,有大量的数据存储在关系型数据库
中。由于没有工具支持,对 和关系型数据库之间数据传输是一个很困难的事。
.4 Sqoop 优点
可以高效、可控的利用资源,可以通过调整任务数来控制任务的并发度。
可以自动的完成数据映射和转换。由于导入数据库是有类型的,它可以自动根据数据库
中的类型转换到 中,当然用户也可以自定义它们之间的映射关系。
支持多种数据库,如 $,"#$ 等数据库。
.5 Sqoop 架构
.5.1 架构图
架构图
版本号:() 以后的是 。
在架构上: 使用 客户端直接提交代码的方式。
访问方式:&* 命令行控制台方式访问。
安全性:命令或者脚本指定用户数据库名和密码。
架构图
版本号:++) 以后的是 。
在架构上: 引入了 "",对 &,,#-" 实现了集中的管理,其访问方式也变
得多样化了,其可以通过 ./01*、%0001*、2.3* 以及 &* 控制台方式进行访问。
访问方式:./01*、%0001*、2.3* 以及 &* 命令行控制台方式访问。
安全性:&* 访问方式,会通过交互过程界面,输入的密码信息不会被看到,同时
引入基于角色的安全机制,比 多了 "" 端。
.5.2 优缺点
:
优点:架构部署简单。
缺点:命令行方式容易出错,格式紧耦合,无法支持所有的数据类型,安全机制不够
晚上,例如:密码暴露、安装需要 "- 权限、#,,#-" 必须符合 %& 模式。
:
优点:多种交互方式,例如:命令行、4'3*、"-、5;#,,#-" 集中化管
理;所有的链接安装在 "" 上、完善的权限管理机制、#,,#-" 规范化、仅仅负
责数据的读写。
缺点:架构稍复杂、配置部署更繁琐。
剩余16页未读,继续阅读
资源评论
goose_flesh
- 粉丝: 15
- 资源: 15
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功