=#9#>$#0.&并是&!"#$%&!'(&提出的,是早起在&EM?#72#*&语就已经
存在,但由于&EM?#72#*&只能满单机上的些数据处需求,法完成
些数据的任务,但是&!"#$%&!'(&作为&!"#$%&的模块,可以借助
!"#$%&的数据处性能,完全胜任这些数据的处任务,另外由于
=#9#>$#0.&早期已存在,因此在编写&!"#$%&!'(&程序的时候,疑降低
的槛。
DataFrame 概述
;:& 以的形式构成的分布式数据集,按照赋予同的名称(相当于加
上&*,-.0#&的&E==)。
A:& 可以看做是个经过优化后的个数据表(9#Q4.)。
J:& 提供类&!'(&的&+?@&如:*.4.,9M5)49.$M#88$.8#9)17M6-.$.&操作结构化
的数据。
L:& 将&EM?#72#*&处数据的经验复到分布式的数据上,应为它的
灵感来&EM?#72#*。
DataFrame 基本 API
;:& F$.#9.&=#9#>$#0.
A:& "$)79!,-.0#
J:& *-16
L:& *.4.,9
R:& 5)49.$
S:& :::
样数据(people.json):
{"name":"张三", "age":18, "sex":"man"}
{"name":"四", "age":28, "sex":"female"}
{"name":"王五", "sex":"man"}
Spark SQL 编程:
val spark = SparkSession.builder().conf(sparkConf).getOrCreate()
// 创建DataFrame 将json件加载为DataFrame
评论2
最新资源