大数据平台包含的组件很多,例如HDFS,yarn,spark,hive,hbase,solr,elastic search,kafka,flume,sqoop,flink,storm,echarts,phoenix,tez, mapreduce,mahout,R,CDH, ambari,cloudera manager等等,很多很多,要熟练掌握大数据平台,就必须掌握所有这些组件的功能和使用方法,以便应对大型项目,根据大数据项目的需求做组件架构方案的技术选型。因此本专辑把平时应用大数据组件的过程中积累的经验和知识搜集起来,分门别类的管理,以便新手能够快速上手,快速部署,真正实践起来,并且在应用过程中避免重复踩那些别人已经踩过的坑。