大数据组件Spark面试题+Spark高频面试题_spark面试题资源-CSDN文库

大数据面试题

5星 · 超过95%的资源需积分: 14 65 浏览量 2023-02-10 22:13:53 上传评论 1 收藏 3.02MB DOCX 举报

资源推荐

资源详情

资源评论

1.10 Spark

1.10.1 Spark 有几种部署方式？请分别简要论述

1）Local:运行在一台机器上，通常是练手或者测试环境。

2）Standalone:构建一个基于 Mster+Slaves 的资源调度集群，Spark 任务提交给 Master

运行。是 Spark 自身的一个调度系统。

3）Yarn: Spark 客户端直接连接 Yarn，不需要额外构建 Spark 集群。有 yarn-client 和

yarn-cluster 两种模式，主要区别在于：Driver 程序的运行节点。

4）Mesos：国内大环境比较少用。

1.10.2 Spark 任务使用什么进行提交，JavaEE 界面还是脚本

Shell 脚本。

1.10.3 Spark 提交作业参数（重点）

参考答案：

https://blog.csdn.net/gamer_gyt/article/details/79135118

1）在提交任务时的几个重要参数

executor-cores —— 每个 executor 使用的内核数，默认为 1，官方建议 2-5 个，我

们企业是 4 个

num-executors —— 启动 executors 的数量，默认为 2

executor-memory —— executor 内存大小，默认 1G

driver-cores —— driver 使用内核数，默认为 1

driver-memory —— driver 内存大小，默认 512M

2）边给一个提交任务的样式

spark-submit \

剩余38页未读，继续阅读

内容反馈

陈游泳

2023-06-10

十分感谢作者的分享，这份文件对我很有帮助，让我更好的了解了Spark。
VashtaNerada

2023-06-10

文件所涉及的知识点非常全面，不仅仅限于面试题，还有不少实用的技巧和经验分享。
张盛锋

2023-06-10

对于想要深入了解Spark的同学来说，这份文件是一个非常好的入门指南，解决了不少学习上的疑惑。
daidaiyijiu

2023-06-10

面试的时候用到的点到点评价真心觉得非常实用，有需要的同学千万不要错过。
航知道

2023-06-10

如果你正在准备Spark面试，不要再犹豫，一定要下载这份文件！

前往

页

风老魔

粉丝: 249
资源: 99

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip