## spark standalone ha 集群
基于rancher构建spark standalone集群,包含3个service:master、worker和client,其中client是用于提交作业的客户端。
并使用zookeeper做了master ha
#### 使用前提
hive元数据库和hdfs集群对应的stack/service已经搭建完毕。
#### 配置方法
需要以下配置:
- `stack_name`:当前stack的名字,默认`spark`,**注:一定要和当前stack名一致**
master相关配置:
- `master_port`:指定master端口,默认`17077`
- `master_webui_port`:指定master web界面的端口,默认`18080`
- `master_daemon_memory`:指定master进程的内存,默认`1g`
worker相关配置:
- `worker_scale`:指定worker个数,默认`2`
- `worker_webui_port`:指定worker web界面的端口,默认`18081`
- `worker_daemon_memory`:指定worker进程的内存,默认`1g`
- `worker_cores`:指定worker可分配的core个数,默认`4`
- `worker_memory`:指定worker可分配的内存大小,默认`2g`
client相关配置:
- `client_number`:提交作业的client的个数,默认`1`
- `client_sshd_port`:sshd端口,默认`1022`(暂时没用)
- `client_app_port`:client运行作业的端口,默认`14040`
- `hdfs_stack_name`:依赖的hdfs的stack名,默认`hdfs`
- `hdfs_name_service`:依赖的hdfs的service名,默认`finogeeks`
- `hdfs_repli_count`:hdfs的副本个数,默认`2`
- `hive_metastore_server_stack`:hive metastore server的stack名,默认`hive`
- `hive_metastore_server_port`:hive metastore server的端口,默认`10000`
#### client使用
默认会生成提交作业模板`/opt/bin/submit.sh_template`,可以根据模板和[spark官方文档](https://spark.apache.org/docs/latest/submitting-applications.html)进行个性化定制。
#### 相关说明
client的配置依赖于hdfs和hive metaStore server对应的配置生成策略,因此,需要根据hdfs和hive的配置变化而变化。
此catalog用于搭建spark standalone集群,依赖于`hiveMetaStoreServer`和`hdfs`。
#### 注意
- 默认hdfs副本数为2,生产环境中建议调整为3
- 默认hiveMetaStoreServer的配置只有一个server,生产环境中建议至少配置2个
- 暴露端口
- master:17077(提交作业)、18080(web ui)
- worker:18081(web ui)
- Client:1022(sshd)、14040(web ui)
#### 参考文章
[spark standalone配置](http://spark.apache.org/docs/latest/spark-standalone.html)
[hive metastore server配置](https://cwiki.apache.org/confluence/display/Hive/AdminManual+MetastoreAdmin)
没有合适的资源?快使用搜索试试~ 我知道了~
spark standalone的集群镜像,基于zk做ha的镜像+源代码+文档说明
共20个文件
sh:7个
xml:3个
yml:2个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 168 浏览量
2024-04-08
10:58:17
上传
评论
收藏 12KB ZIP 举报
温馨提示
- 不懂运行,下载完可以私聊问,可远程教学 该资源内项目源码是个人的毕设,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! <项目介绍> 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 --------
资源推荐
资源详情
资源评论
收起资源包目录
docker-spark-ha-master.zip (20个子文件)
docker-spark-ha-master
.gitattributes 66B
rancher-compose.yml 4KB
docker-compose.yml 3KB
build-image.sh 70B
Dockerfile 1KB
version 6B
README.md 3KB
config
init_master_conf.sh 1KB
spark-env.sh_master 489B
init_client_conf.sh 661B
hadoop
core-site.xml 591B
hdfs-site.xml 1KB
init_hive_conf.sh 448B
init_hdfs_conf.sh 724B
hive-site.xml 711B
start.sh 1006B
init_worker_conf.sh 1KB
spark-env.sh_worker 637B
log4j.properties 2KB
spark-defaults.conf 274B
共 20 条
- 1
资源评论
机器学习的喵
- 粉丝: 491
- 资源: 1259
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于pygame实现的烟花代码
- mcu-printf关于51单片机使用printf函数进行串口调试的方法
- MySQL和数据表操作
- 微信小程序面试题.pdf
- 基于matlab实现电力系统仿真计算软件包,包括潮流计算,最优潮流计算等.rar
- 基于matlab实现电力系统各种故障波形仿真,单相接地故障,两相间短路,两相接地短路,三相短路等.rar
- 基于matlab实现电动汽车动力性,爬坡性,续驶里程等性能仿真.rar
- Python动态烟花代码.pdf
- 基于matlab实现串口发送接收数据 可配置端口,波特率等 发送可选择ASCII方式或HEX方式
- matlab基于BP神经网络手写字母识别(单一).zip代码9
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功