本书封面贴有清华大学出版社防伪标签,无标签者不得销售。本书封面贴有清华大学出版社防伪标签,无标签者不得销售。
版权所有,侵权必究。侵权举报电话:版权所有,侵权必究。侵权举报电话:010-62782989 13701121933
图书在版编目(图书在版编目(CIP)数据)数据
Hadoop构建数据仓库实践/王雪迎著.—北京:清华大学出版社,2017
ISBN 978-7-302-46980-3
Ⅰ.①H… Ⅱ.①王… Ⅲ.①数据处理软件 Ⅳ.①TP274
中国版本图书馆CIP数据核字(2017)第100408号
责任编辑:责任编辑: 夏毓彦
封面设计:封面设计: 王 翔
责任校对:责任校对: 闫秀华
责任印制:责任印制:
出版发行:出版发行: 清华大学出版社
网 址:网 址: http://www.tup.com.cn,http://www.wqbook.com
地 址:地 址: 北京清华大学学研大厦A座
邮 编:邮 编: 100084
社社 总总 机:机: 010-62770175
邮 购:邮 购: 010-62786544
投稿与读者服务:投稿与读者服务: 010-62776969,c-service@tup.tsinghua.edu.cn
质量反馈:质量反馈: 010-62772015,zhiliang@tup.tsinghua.edu.cn
印印 装装 者:者: 清华大学印刷厂
经 销:经 销: 全国新华书店
开 本:开 本: 190mm×260mm
印 张:印 张: 27.75
字 数:字 数: 710千字
版 次:版 次: 2017年7月第1版
印 次:印 次: 2017年7月第1次印刷
印 数:印 数: 1~3500
定 价:定 价: 89.00元
产品编号:072501-01
作者简介作者简介
王雪迎,毕业于中国地质大学计算机专业,高级工程师,拥有20年数据库、数据仓库相关技术经验。曾先后供职于北京现代商
业信息技术有限公司、北京在线九州信息技术服务有限公司、华北计算技术研究所、北京优贝在线网络科技有限公司,担任
DBA、数据架构师等职位。
内容简介内容简介
本书讲述在流行的大数据分布式存储和计算平台Hadoop上设计实现数据仓库,将传统数据仓库建模与SQL开发的简单性与
大数据技术相结合,快速、高效地建立可扩展的数据仓库及其应用系统。
本书内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用HIVE进行数
据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala进行快速联机数据分析,使用Hue将数据可视化,以及数据仓
库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问
题在Hadoop上的处理等。
本书适合数据库管理员、大数据技术人员、Hadoop技术人员、数据仓库技术人员,也适合高等院校和培训机构相关专业
的师生教学参考。