大数据hive、spark讲义,从hdfs读写、yarn管理机制、元数据原理、数据质量管理等,全套架构逻辑梳理
Hadoop集群搭建、HDFS分布式文件系统、MapReduce分布式计算框架以及Yarn资源调度组件的应用和原理。具体而言,本套文档介绍了大数据的总体情况,指导了如何建立Hadoop集群,深入解释了HDFS的各种机制和调优方法,分析了MapReduce计算框架的核心阶段,以及Yarn在资源调度方面的原理和应用。
0
28
78.95MB
2023-12-22
0