数据仓库(DataWarehouse)是一个面向主题的(SubjectOriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,用于支持管理决策。无法满足快速增长的海量数据存储需求。无法有效处理不同类型的数据。计算和处理能力不足。Hive是一个构建于Hadoop顶层的数据仓库工具,可以查询和管理PB级别的分布式数据。支持大规模数据存储、分析,具有良好的可扩展性某种程度上可以看作是用户编程接口,本身不存储和处理数据。依赖分布式文件系统HDFS存储数据。依赖分布式并行计算模型MapReduce处理数据。定义了简单的
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~