Hadoop构建数据仓库实践
电子书推荐
-
Hadoop构建数据仓库实践_王雪迎PDF原版 评分:
《Hadoop构建数据仓库实践》讲述在流行的大数据分布式存储和计算平台Hadoop上设计实现数据仓库,将传统数据仓库建模与SQL开发的简单性与大数据技术相结合,快速、高效地建立可扩展的数据仓库及其应用系统。 本书内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用HIVE进行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala进行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。 本书适合数据库管理员、大数据技术人员、Hadoop技术人员、数据仓库技术人员,也适合高等院校和培训机构相关专业的师生教学参考。 第1章 数据仓库简介 第2章 数据仓库设计基础 第3章 Hadoop生态圈与数据仓库 第4章 安装Hadoop 第5章 Kettle与Hadoop 第6章 建立数据仓库示例模型 第7章 数据抽取 第8章 数据转换与装载 第9章 定期自动执行ETL作业 第10章 维度表技术 第11章 事实表技术 第12章 联机分析处理 第13章 数据可视化
上传时间:2019-03 大小:14.64MB
- 10.74MB
Hadoop构建数据仓库实践1_hadoop_
2021-10-03Hadoop构建数据仓库实践1——王雪迎
- 14.61MB
Hadoop 构建数据仓库
2019-03-28《Hadoop构建数据仓库实践》,高清,有详细目录,PDF版
- 14.97MB
hadoop构建数据仓库
2019-03-25本书讲述在流行的大数据分布式存储和计算平台 Hadoop 上设计实现数据仓库,将传统数据仓库建模与 SQL 开发的简单性与 大数据技术相结合,快速、高效地建立可扩展的数据仓库及其应用系统。
- 1.6MB
Hadoop数据仓库工具hive介绍.pdf
2012-03-09Hadoop数据仓库工具hive介绍
- 2.94MB
数据仓库技术在大众点评网的实践和案例分享
2017-01-31数据仓库技术在大众点评网的实践和案例分享
- 952KB
hadoop_dll_winutil_2.7.3_x64.zip
2017-11-16windows 64位下hadoop2.7.3搭建环境所需的hadoop.dll及winutil.exe等
- 6.49MB
Hadoop_for_Dummies_Oct_2012_Final.pdf
2014-08-07Hadoop_for_Dummies_Oct_2012_Final.pdf主要介绍了Hadoop关键技术发展情况,是分布式技术的科普片
- 8.37MB
Hadoop数据分析_大数据_hadoop_数据分析_
2021-10-01针对数据分析介绍分布式计算涉及的大量概念、工具和技术,纵览Hadoop生态系统。
- 1.62MB
大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第5期_Hadoop安装配置 共44页.pdf
2022-03-20大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第5期_Hadoop安装配置 共44页.pdf
- 9.61MB
hadoop_the_definitive_guide_3nd_edition.pdf
2018-02-26hadoop_the_definitive_guide_3nd_edition.pdf 。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
- 7.22MB
基于Hadoop构建数据仓库平台(DAAS)
2013-09-17分享嘉宾:童小军(Hadoop大数据红象(RedHadoop)云腾公司 创始人) 内容介绍:讲解Hadoop生态系统介绍和演示,结合成功项目经验,与听众交流Hadoop运用与开发技巧。讲解Hadoop对于游戏公司起到的效用,讲解分析运营商云系统中的Hadoop应用策略,以及使用Hadoop/Hbase解决3G详单查询问题等。
- 182KB
数据仓库规范设计.pdf
2019-11-04数据仓库规范设计.pdf
- 8.24MB
智慧校园大数据仓库及信息共享平台项目建设方案.pdf
2020-12-26通过对各业务系统数据的整合,汇集完成统一标准化数据仓库的建设,在数据仓库的基础上建立 OLAP 服务器实现校园数据的多维分析、复杂数据统计和数据挖掘等功能,为校园的各智能分析系统提供完善的数据平台。建设一套完整的数据仓库平台作为数据应用平台的数据基础,涵盖了数据支撑平台、数据治理平台,负责整个数据的集成、管理、存储、治理等,同时提供数据访问、数据处理、数据归档等一系列标准规范
- 334KB
数据仓库建模技术.pdf
2012-05-27数据仓库建模技术.pdf
- 2.50MB
Hadoop_in_Action.pdf
2014-11-30Hadoop_in_Action.pdf
- 1.44MB
大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第4期_SecureCRT使用 共17页.pdf
2022-03-20大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第4期_SecureCRT使用 共17页.pdf
- 677KB
大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第12期_HBase应用开发_V1.0 共39页.pdf
2022-03-20大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第12期_HBase应用开发_V1.0 共39页.pdf
- 1023KB
大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第14期_Hive应用开发_V1.0 共29页.pdf
2022-03-20大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第14期_Hive应用开发_V1.0 共29页.pdf
- 807KB
大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第3期_VSFTP安装配置 共22页.pdf
2022-03-20大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第3期_VSFTP安装配置 共22页.pdf
- 463KB
大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第6期_WordCount运行详解 共18页.pdf
2022-03-20大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第6期_WordCount运行详解 共18页.pdf
- 1.17MB
大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第11期_HBase简介及安装_V1.0 共21页.pdf
2022-03-20大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第11期_HBase简介及安装_V1.0 共21页.pdf
- 2.28MB
大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第10期_MySQL关系数据库 共47页.pdf
2022-03-20大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第10期_MySQL关系数据库 共47页.pdf
- 1.54MB
大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第13期_Hive简介及安装_V1.0 共23页.pdf
2022-03-20大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第13期_Hive简介及安装_V1.0 共23页.pdf
- 1.6MB
大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第9期_MapReduce初级案例 共43页.pdf
2022-03-20大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第9期_MapReduce初级案例 共43页.pdf
- 1.22MB
大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第8期_HDFS初探之旅 共29页.pdf
2022-03-20大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第8期_HDFS初探之旅 共29页.pdf
- 191.6MB
项目源码:基于Hadoop+Spark招聘推荐可视化系统 大数据项目 计算机毕业设计
2023-10-30项目源码:基于Hadoop+Spark招聘推荐可视化系统 大数据项目 计算机毕业设计 基于Hadoop+Spark的招聘推荐可视化系统是一种利用Hadoop和Spark等大数据处理技术,实现招聘推荐和可视化展示的应用系统。以下是该系统的主要介绍: 数据采集:系统通过各种渠道(如招聘网站、社交媒体等)获取大量的招聘相关数据,包括职位信息、公司信息、求职者信息等。这些数据以结构化或半结构化形式存在。 数据存储与处理:系统利用Hadoop分布式文件系统(HDFS)存储采集到的招聘数据,并使用Hadoop生态圈中的工具(如Hive、HBase等)进行数据处理和管理。Spark作为数据处理引擎,提供高性能的批处理和实时计算能力,对招聘数据进行清洗、转换和特征提取等操作。 招聘推荐:系统利用Spark的机器学习库(如MLlib)构建候选模型,通过对求职者的个人资料、工作经历、技能等特征进行分析,匹配合适的职位和公司。系统可以根据用户的偏好和需求,向其推荐最相关的招聘信息。 可视化展示:系统利用可视化工具(如matplotlib、Plotly等)将招聘数据以各种图表、图形等形式可视化展示。
- 685.0MB
hadoop-3.3.4.tar.gz + winutils 安装环境
2023-08-03【开发环境】安装 Hadoop 运行环境 ( 下载 Hadoop | 解压 Hadoop | 设置 Hadoop 环境变量 | 配置 Hadoop 环境脚本 | 安装 winutils ) https://hanshuliang.blog.csdn.net/article/details/132045605 一、下载 Hadoop 二、解压 Hadoop 三、设置 Hadoop 环境变量 四、配置 Hadoop 环境脚本 五、安装 winutils 六、重启电脑 七、验证 Hadoop 安装效果
- 1.49MB
基于Hadoop的电影影评数据分析
2023-04-04是大数据课程大作业,基于Hadoop的电影影评数据分析,需要安装Hadoop,了解MapReduce 和HDFS。
- 1.65MB
基于大数据的音乐推荐系统(适合本科毕设)
2023-02-02主要是用于大家对于大数据的基本处理,适合大学生本科毕设的参考。
- 191.6MB
基于Hadoop+Spark招聘推荐可视化系统 大数据项目 毕业设计(源码下载)
2023-10-21基于Hadoop+Spark招聘推荐可视化系统 大数据项目 毕业设计(源码下载) 基于Hadoop+Spark的招聘推荐可视化系统是一种利用Hadoop和Spark等大数据处理技术,实现招聘推荐和可视化展示的应用系统。以下是该系统的主要介绍: 数据采集:系统通过各种渠道(如招聘网站、社交媒体等)获取大量的招聘相关数据,包括职位信息、公司信息、求职者信息等。这些数据以结构化或半结构化形式存在。 数据存储与处理:系统利用Hadoop分布式文件系统(HDFS)存储采集到的招聘数据,并使用Hadoop生态圈中的工具(如Hive、HBase等)进行数据处理和管理。Spark作为数据处理引擎,提供高性能的批处理和实时计算能力,对招聘数据进行清洗、转换和特征提取等操作。 招聘推荐:系统利用Spark的机器学习库(如MLlib)构建候选模型,通过对求职者的个人资料、工作经历、技能等特征进行分析,匹配合适的职位和公司。系统可以根据用户的偏好和需求,向其推荐最相关的招聘信息。 可视化展示:系统利用可视化工具(如matplotlib、Plotly等)将招聘数据以各种图表、图形等形式可视化展示。例如,