1. 大数据概述部分主要考查了大数据的基本概念、特征、发展阶段、思维转变、计算模式等基础知识。
2. Hadoop部分重点考查了Hadoop的核心组成、特性、生态系统组件以及HDFS相关的理论和操作。
3. HBase部分着重考查了HBase作为分布式NoSQL数据库的数据模型、架构设计、基本概念和shell命令操作。
4. MapReduce部分主要考查了MapReduce这一分布式计算模型的原理、编程实现和与传统并行计算框架的区别。
5. 数据仓库Hive和Impala部分考查了Hive/Impala在大数据生态中的定位、基本命令以及与传统数据仓库的区别。
6. Spark部分主要考查了Spark的特性、运行架构、编程模型、Scala语言与RDD等核心概念。
7. 流计算部分着重考查了流计算的基本理念、架构设计、开源框架Storm等知识点。
8. 图计算部分重点考查了以Pregel为代表的图计算框架的工作原理、应用场景等。
9. 还涉及了大数据应用、NoSQL数据库、云数据库等相关内容。
总的来说,这份试卷知识点饱满,难度适中,比较全面系统地检验了大数据处理的方方