没有合适的资源？快使用搜索试试~ 我知道了~

文库首页大数据sparkSpark读取HbaseRDD的过程及源码解析

Spark读取HbaseRDD的过程及源码解析

spark

需积分: 1 0 下载量 170 浏览量 2023-04-07 17:16:33 上传评论收藏 136KB PDF 举报

温馨提示

试读

6页

Spark读取HbaseRDD的过程及源码解析

资源推荐

资源详情

资源评论

浪尖 qq 技术交流群 459898801 224209501

Spark 读取 HbaseRDD 的过程

1,构建 hbaseRDD

val hbaseRDD = sc.newAPIHadoopRDD(confHbase, classOf[TableInputFormat],

classOf[org.apache.hadoop.hbase.io.ImmutableBytesWritable],

classOf[org.apache.hadoop.hbase.client.Result])

2,构建 NewHadoopRDD

new NewHadoopRDD(this, fClass, kClass, vClass, jconf)

3,getPartitions 方法

Table 的初始化

val inputFormat = inputFormatClass.newInstance

inputFormat match {

case configurable: Configurable =>

configurable.setConf(_conf)

case _ =>

}

TableInputFormat 的 setConf 方法，给 InputFormat 设置表

this.conf = configuration;

String tableName = conf.get(

INPUT_TABLE

);

try {

setHTable(new HTable(new Configuration(conf), tableName));

} catch (Exception e) {

LOG.error(StringUtils.

stringifyException

(e));

}

初始化 scan，会先会获取用户设置的 scan 方法，然后再跟进多种情况进行构建。

Scan scan = null;

if (conf.get(

SCAN

) != null) {

try {

scan = TableMapReduceUtil.

convertStringToScan

(conf.get(

SCAN

));

} catch (IOException e) {

LOG.error("An error occurred.", e);

}

} else {

try {

scan = new Scan();

if (conf.get(

SCAN_ROW_START

) != null) {

scan.setStartRow(Bytes.

toBytes

(conf.get(

SCAN_ROW_START

)));

}

if (conf.get(

SCAN_ROW_STOP

) != null) {

scan.setStopRow(Bytes.

toBytes

(conf.get(

SCAN_ROW_STOP

)));

}

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余5页未读，立即下载

评论收藏

内容反馈

资源评论

资源反馈

评论星级较低，若资源使用遇到问题可联系上传者，3个工作日内问题未解决可申请退款~

小萝卜算子

粉丝: 68
资源: 20

上传资源快速赚钱

我的内容管理展开

我的资源快来上传第一个资源

我的收益

登录查看自己的收益

我的积分登录查看自己的积分

我的C币登录后查看C币余额

我的收藏

我的下载

下载帮助

前往需求广场，查看用户热搜

Spark读取HbaseRDD的过程及源码解析

Spark Streaming运行流程及源码解析（一）

Spark-Sql源码解析

Spark-内核源码解析.docx

Spark-LiveListenerBus 消息总线 源码解析

Spark源码系列（一）spark-submit提交作业过程

Spark源码剖析

spark读取hbase数据，并使用spark sql保存到mysql

深入理解Spark：核心思想及源码分析.pdf

spark-广播变量基础及源码解析

Spark源码系列（三）作业运行过程

Spark源码系列（六）Shuffle的过程解析

深入理解Spark+核心思想与源码分析.pdf

Spark-2.3.1源码解读

Spark源码深度解读

深入理解Spark 核心思想与源码分析

spark sql解析-源码分析

spark sftp

读取XML文件的四种方法

spark源码包

Spark 读取HDFS保存mongodb

spark源码分析系列

第十五届蓝桥杯大赛软件赛省赛-PythonB组题目

YOLOV5口罩检测数据集+代码+模型 2000张标注好的数据+教学视频.zip

（免费）Chrome浏览器插件axure-chrome-extension

axure谷歌浏览器插件

免费插件-AI插件-illustrator插件集合-尺寸标注-智能填充-颜色自动处理-自动批处理-Windows安装包.zip

第十五届蓝桥杯大赛软件赛省赛-PythonA组题目

最新资源

Spark-LiveListenerBus 消息总线源码解析