大数据工作面试练习题BAT大数据面试题Hadoop、kafka、HDFS、Spark、MapReduce共19页.pdf

版权申诉

174 浏览量 2023-04-24 23:14:38 上传评论收藏 366KB PDF 举报

资源推荐

资源详情

资源评论

2018 最新 BAT 大数据面试题

2018 最新 BAT 大数据面试题 ............................................................................. 1

1、kafka 的 message 包括哪些信息？ ................................................................ 3

2、怎么查看 kafka 的 offset？ ............................................................................. 3

3、hadoop 的 shuffle 过程是？ ............................................................................ 3

4、spark 集群运算的模式？ ................................................................................ 5

5、HDFS 读写数据的过程？ .............................................................................. 5

6、RDD 中 reduceBykey 与 groupByKey 哪个性能好，为什么 ...................... 6

7、spark2.0 的了解 ............................................................................................... 7

8、rdd 怎么分区宽依赖和窄依赖 ....................................................................... 7

9、spark streaming 读取 kafka 数据的两种方式 ............................................... 8

10、kafka 的数据存在内存还是磁盘 .................................................................. 8

11、怎么解决 kafka 的数据丢失 ......................................................................... 9

12、fsimage 和 edit 的区别？ ............................................................................ 10

13、列举几个配置文件优化？.......................................................................... 10

14、datanode 首次加入 cluster 的时候，如果 log 报告不兼容文件版本，那

需要 namenode 执行格式化操作，这样处理的原因是？ ...................................... 11

15、MapReduce 中排序发生在哪几个阶段？这些排序是否可以避免？为什

么？.............................................................................................................................. 11

16、hadoop 的优化？ ......................................................................................... 12

剩余18页未读，继续阅读

评论收藏

内容反馈

版权申诉

passionSnail

粉丝: 407
资源: 5624

大数据工作面试练习题 BAT大数据面试题 Hadoop、kafka、HDFS、Spark、MapReduce 共19页.pdf

最新资源

大数据工作面试练习题 BAT大数据面试题 Hadoop、kafka、HDFS、Spark、MapReduce 共19页.pdf

大数据笔记，包含Hadoop、Spark、Flink、Hive、Kafka、Flume、ZK......

Hadoop/HDFS/MapReduce/HBase

Hadoop HDFS和MapReduce架构浅析.pdf

最新大数据Hadoop面试题!(附答案解析).pdf

Hadoop+HDFS和MapReduce架构浅析

Hadoop介绍，HDFS和MapReduce工作原理

《Hadoop大数据开发实战》教学教案—01初识Hadoop.pdf

Hadoop_HDFS和MapReduce架构浅析_郝树魁.pdf

Hadoop中HDFS和MapReduce框架介绍pdf

大数据与云计算教程课件 优质大数据课程 08.HDFS文件接口（共41页）.pptx

精品课程推荐 大数据与云计算教程课件 优质大数据课程 06.HDFS（共38页）.pptx

大数据与云计算教程课件 优质大数据课程 30.Kafka开发（共34页）.pptx

精品课程推荐 大数据与云计算教程课件 优质大数据课程 02.MapReduce（共23页）.pptx

精品课程推荐 大数据与云计算教程课件 优质大数据课程 07.HDFS Shell命令（共21页）.pptx

hadoop最新版本3.1.1全量jar包

精品课程推荐 大数据与云计算教程课件 优质大数据课程 29.Kafka（共30页）.pptx

精品课程推荐 大数据与云计算教程课件 优质大数据课程 14.Hadoop集群配置（共6页）.pptx

精品课程推荐 大数据与云计算教程课件 优质大数据课程 03.Hadoop YARN（共25页）.pptx

精品课程推荐 大数据与云计算教程课件 优质大数据课程 09.MapReduce序列化（共29页）.pptx

项目源码：基于Hadoop+Spark招聘推荐可视化系统 大数据项目 计算机毕业设计

hadoop-3.3.4.tar.gz + winutils 安装环境

基于Hadoop的电影影评数据分析

基于大数据的音乐推荐系统（适合本科毕设）

基于Hadoop+Spark招聘推荐可视化系统 大数据项目 毕业设计（源码下载）

适用于hadoop 3.3.5 3.3.6版本的winutils

数据科学导论实验报告 实验1：常用Linux操作和 Hadoop操作

淘宝用户行为数据集

中文官方教程_tableau_prep.pdf

hadoop-3.1.3.tar.gz

最新资源

大数据与云计算教程课件优质大数据课程 08.HDFS文件接口（共41页）.pptx

精品课程推荐大数据与云计算教程课件优质大数据课程 06.HDFS（共38页）.pptx

大数据与云计算教程课件优质大数据课程 30.Kafka开发（共34页）.pptx

精品课程推荐大数据与云计算教程课件优质大数据课程 02.MapReduce（共23页）.pptx

精品课程推荐大数据与云计算教程课件优质大数据课程 07.HDFS Shell命令（共21页）.pptx

精品课程推荐大数据与云计算教程课件优质大数据课程 29.Kafka（共30页）.pptx

精品课程推荐大数据与云计算教程课件优质大数据课程 14.Hadoop集群配置（共6页）.pptx

精品课程推荐大数据与云计算教程课件优质大数据课程 03.Hadoop YARN（共25页）.pptx

精品课程推荐大数据与云计算教程课件优质大数据课程 09.MapReduce序列化（共29页）.pptx

项目源码：基于Hadoop+Spark招聘推荐可视化系统大数据项目计算机毕业设计

基于Hadoop+Spark招聘推荐可视化系统大数据项目毕业设计（源码下载）

数据科学导论实验报告实验1：常用Linux操作和 Hadoop操作