本文来自于csdn,主要为对HBase简介,HBase数据模型及物理模型,HBase架构及工作原理。HBase是一个构建在HDFS之上的,分布式的、面向列的开源数据库HBase是GoogleBigTable的开源实现,它主要用于存储海量数据个人理解:分布式:采用分而治之的思想,比如说我们要将10个G的数据全部写入到HBase,对于这样的一个任务我们可以通过10个节点来处理(并行处理),这样可以大大的提高执行效率。面向列:一个表中是有很多行很多列,面向列的存储就是将多个列存储在一块,HBase里是通过列族来组织的,实际开发中我们查询可能只会查询某几个列,面向列存储后,会减少磁盘和网络IO的开销从