没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
大数据性能优化
郭太萍
目录
1 、分布式集群
2 、 Hive 的产生背景
3 、优化目标
4 、任务执行流程
5 、 hive mapreduce 调优
6 、 sql 优化
分布式集群
PART 01
关于分布式集群
集群: 众多相同的业务,部署在众多不同机器上, 分
别执行。 这些众多机器之间,不需要沟通配合。
分布式:同一个业务,拆分后,由多个机器分别来执行,
这些众多机器之间, 需要沟通配合。
看不懂?举个栗子:
小饭店原来只有一个厨师,切菜洗菜备料炒菜全干。
后来客人多了,厨房一个厨师忙不过来,又请了个厨师,
两个厨师都能炒一样的菜,两个厨师的关系是集群。
为了让厨师专心炒菜,把菜做到极致,再请了个配菜师
负责切菜,备菜,备料 厨师和配菜师的关系是分布
式。
一个配菜师也忙不过来了,又请了个配菜师,两个配菜
师关系是集群。
一个配菜师因故请假了,但是其余的配菜师还是该啥就
干啥,只是没请假的配菜师任务均匀的加量了,但他们
的任务和职责是不变的,这是集群。
hadoop 框架结构图
HDFS
可靠的分布式文件系统
HBASE
实时、分布式、高维数据库
MapReduce
分布式计算框架
Sqoo
p
关系型数
据库同步
工具
Flume
日志采集
工具
分布式协作服
务
HIVE
离线数据仓
库
Mahout
数据挖掘
R-
statics
数据分析
Pig
数据流
处理
剩余55页未读,继续阅读
资源评论
chimchim66
- 粉丝: 9700
- 资源: 6
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功