1.hbase和hive的区别;
2.hbase架构;
3.spark core怎么对数据处理(清洗,提取);
4.RDD中常用的方法;
5.DataFrame和DataSet的区别;
6.简历中的技术问题:
1.对spark core和sparkSQL的能够实现的功能不明确:比如
1.在简历中spark core体现的作用仅仅是用于数据的ETL操作,而sparkSQL是用户分析清洗后的数据;
2.实际sparkSQL能干的事spark core都能干,并且一些复杂的分析使用sparkSQL不能干但是spark core也能干
Mapreduce的过程
隐式转换
模式匹配和java中switch case的区别
hive hbase中遇到的问题 -可以提及数据倾斜 和 热点问题
spark性能优化
项目架构流程
rowkey的设计 编码后如何读取
技术问题:
topkey
hbase读写流程
为什么选用hbase
scala中常用的方法
Scala中的集合与java的区别
Scala如何与java进行集成
spark优化
本内容试读结束,登录后可阅读更多
下载后可阅读完整内容,剩余1页未读,立即下载