Spark文档下载地址、SparkSQL文档资源下载-时下握今的资源-CSDN下载

SparkSQL的数据结构DataFrame构建方式

SparkSQL的数据结构DataFrame构建方式

评级：0

浏览量：33

资源大小：9KB

上传时间：2023-07-04

所需积分： 5
SparkSQL的分布式执行引擎(Spark ThriftServer)

SparkSQL的分布式执行引擎(Spark ThriftServer)

评级：0

浏览量：51

资源大小：32.88MB

上传时间：2023-07-03

所需积分： 5
Spark - Resilient Distributed Datasets (RDDs)介绍

RDD分区调整、聚合函数、关联函数的算子运用

评级：0

浏览量：37

资源大小：2KB

上传时间：2023-06-24

所需积分： 5
SparkStreaming入门案例

本文SparkStream从磁盘文件、HDFS、KAFKA获取数据源，以单词频次统计作为入门案例，介绍了SparkStream模块API的使用。同时介绍了SparkStream的特点

评级：0

浏览量：384

资源大小：354KB

上传时间：2020-06-22

所需积分： 22
SparkSQL入门级教程

本文讲述了Array、List、Map、本地磁盘文件、HDFS文件转化为DataFrame对象的方法；通过实际操作演示了dataFrame实例方法操作DataFrame对象、SQL语言操作DataFrame对象和ScalaAPI操作DataFrame对象

评级：0

浏览量：456

资源大小：576KB

上传时间：2020-06-19

所需积分： 50
HABASE概述及安装.docx

本文概述了hbase的定义、hbase的特点、hbase数据库的优缺点讲述了hbase数据库在linux上搭建集群的步骤

评级：0

浏览量：191

资源大小：279KB

上传时间：2020-05-26

所需积分： 23
Flume的channel和sink.docx

本文讲述了flume中channel和sink简单描述和linux配置包括：Memory channel、File channel及其它测试阶段的Channel；及channel通过sink的输出配置Logger Sink、File Roll Sink、HDFS Sink、Avro Sink(多级流动、扇入流动、扇出流动)；及Source端增加的一些选择器、拦截器：多路复用/路由器Selector、timestamp拦截器、Serach And Replace Interceptor、Regex Filter Interceptor、Regex Extractor Interceptor、Host Interceptor、Static Interceptor、UUID Interceptor；最后讲述了一个channel通过负载均衡机制，匹配多个sink中个一个输出

评级：0

浏览量：202

资源大小：1.01MB

上传时间：2020-05-16

所需积分： 9
Flume.docx

本文章讲述日志收集框架-Flume中的Agent组件的三部分Source、channel、sink； linux中angent组件的配置，启动命令及测试结果；flume-source中不符合场景的source自定义实现

评级：0

浏览量：89

资源大小：884KB

上传时间：2020-05-13

所需积分： 5