• Spark介绍.docx

    spark是专为大规模数据处理而设计的快速通用的计算引擎。它是在内存中计算,可以进行迭代计算(是指将计算结果代回原变量进行重复计算,直到满足特定数值条件为止)。mapreduce是基于硬盘计算,所以spark计算速度比mapreduce快好多,mapreduce不是流式计算。Spark针对持续性数据流的抽象称为DStream,一个DStream是一个微批处理的RDD

    0
    149
    748KB
    2019-10-26
    9
  • phoenix介绍.docx

    在HBase中,只有一个单一的按照字典序排序的rowKey索引,当使用rowKey来进行数据查询的时候速度较快,但是如果不使用rowKey来查询的话就会使用filter来对全表进行扫描,很大程度上降低了检索性能。而Phoenix提供了二级索引技术来应对这种使用rowKey之外的条件进行检索的场景。

    0
    96
    228KB
    2019-10-26
    9
  • hdfs,hbase命令原理介绍

    主要介绍了hdfs优缺点,存储策略,还有读写原理,以及hbase一些简单介绍

    0
    205
    238KB
    2018-11-23
    19
  • Hbase权限设置

    文件主要介绍如何在CDH集群安装模式下如何实现Hbase的权限控制,及Hbase常用的权限控制命令

    0
    930
    95KB
    2018-07-14
    33
  • 大数据组件介绍PPT

    主要介绍Hadoop,Spark,Sqoop,Hbase,kafka等大数据相关组件,以及Apache原生集群以及CDH一键安装方式,最后介绍作者所在公司的应用场景

    5
    1022
    1.43MB
    2018-07-14
    48
上传资源赚积分or赚钱