前面几篇文章主要介绍的是sparksql包里的的sparksql执行流程,以及Catalyst包内的SqlParser,Analyzer和Optimizer,最后要介绍一下Catalyst里最后的一个Plan了,即PhysicalPlan。物理计划是SparkSQL执行Sparkjob的前置,也是最后一道计划。如图:话接上回,Optimizer接受输入的AnalyzedLogicalPlan后,会有SparkPlanner来对OptimizedLogicalPlan进行转换,生成Physicalplans。SparkPlanner继承了SparkStrategies,SparkStrategi