没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
史上最全的大数据面试题(大数据开发,大数
据运维)
目录
第 1 章 项目涉及技术 12
1.1 Linux&Shell 相关总结 12
1.1.1 Linux 常用命令 12
1.1.2 Shell 常用工具 12
1.2 Hadoop 相关总结 12
1.2.1 Hadoop 常用端口号 12
1.2.2 Hadoop 配置文件以及简单的 Hadoop 集群搭建 12
1.2.3 HDFS 读流程和写流程 13
1.2.4 MapReduce 的 Shuffle 过程及 Hadoop 优化(包括:压缩、小文件、集群优化) 14
1.2.5 Yarn 的 Job 提交流程 17
1.2.6 Yarn 的默认调度器、调度器分类、以及他们之间的区别 17
1.2.7 项目经验之 LZO 压缩 18
1.2.8 Hadoop 参数调优 19
1.2.9 项目经验之基准测试 19
1.2.10 Hadoop 宕机 19
1.2.11 Hadoop 解决数据倾斜方法 19
1.3 Zookeeper 相关总结 20
1.3.1 选举机制 20
1.3.2 常用命令 20
1.4 Flume 相关总结 21
1.4.1 Flume 组成,Put 事务,Take 事务 21
1.4.2 Flume 拦截器 21
1.4.3 Flume Channel 选择器 22
1.4.4 Flume 监控器 22
1.4.5 Flume 采集数据会丢失吗?(防止数据丢失的机制) 22
1.4.6 Flume 内存 22
1.4.7 FileChannel 优化 22
1.4.8 HDFS Sink 小文件处理 23
1.4.9 HDFS Sink 小文件处理 23
1.5 Kafka 相关总结 24
1.5.1 Kafka 架构 24
1.5.2 Kafka 压测 24
1.5.3 Kafka 的机器数量 24
1.5.4 Kafka 的日志保存时间 24
1.5.5 Kafka 的硬盘大小 24
1.5.6 Kafka 监控 24
1.5.7 Kakfa 分区数 25
1.5.8 副本数设定 25
1.5.9 多少个 Topic 25
1.5.10 Kafka 丢不丢数据 25
1.5.11 Kafka 的 ISR 副本同步队列 25
1.5.12 Kafka 分区分配策略 25
1.5.13 Kafka 中数据量计算 26
1.5.14 Kafka 挂掉 26
1.5.15 Kafka 消息数据积压,Kafka 消费能力不足怎么处理? 26
1.5.16 Kafka 幂等性 26
1.5.17 Kafka 事务 27
1.5.18 Kafka 数据重复 27
1.5.19 Kafka 参数优化 27
1.5.20 Kafka 高效读写数据 28
1.6 Hive 总结 30
1.6.1 Hive 的架构 30
1.6.2 Hive 和数据库比较 30
1.6.3 内部表和外部表 31
1.6.4 4 个 By 区别 31
1.6.5 窗口函数 31
1.6.6 自定义 UDF、UDTF 32
1.6.7 Hive 优化 32
1.6.8 Hive 解决数据倾斜方法 34
1.6.9 用的是动态分区吗?动态分区的底层原理是什么? 37
26. Hive 里边字段的分隔符用的什么?为什么用\t?有遇到过字段里边有\t 的情况吗,
怎么处理的?为什么不用 Hive 默认的分隔符,默认的分隔符是什么? 37
1.7 HBase 总结 37
1.7.1 HBase 存储结构 37
1.7.2 RowKey 设计原则 38
1.7.3 RowKey 如何设计 38
1.7.4 Phoenix 二级索引(讲原理) 38
1.8 Sqoop 参数 38
1.8.1 Sqoop 导入导出 Null 存储一致性问题 38
1.8.2 Sqoop 数据导出一致性问题 38
1.8.3 Sqoop 底层运行的任务是什么 39
1.8.4 Sqoop 数据导出的时候一次执行多长时间 39
1.8.5 Sqoop 一天导多少数据 39
剩余22页未读,继续阅读
资源评论
weixin_38532821
- 粉丝: 0
- 资源: 2
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 微信小程序 - 图书管理系统源码.zip
- 微信小程序 - 图片自适应 ,富文本解析源码.zip
- 微信小程序 - 同乐居商城:购物车合算源码
- 1、根据输入的三条边值判断能组成何种三角形,并设计测试数据进行判定覆盖测试 三条边为变量a、b、c,范围为1≤边值≤10,不在范
- SQL server 练习题目8道(小白教学).zip
- Python 手写实现 iD3 决策树算法-根据信息增益公式.zip
- 411675952289057车联助手-小窗版(三星)3.5.1.apk
- 三种快速排序方法合并在一个文件中以便直接运行的Python代码示例
- 937712277954201实习5.word
- 2程序语言基础知识pdf1_1716337722703.jpeg
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功