16章-数据仓库与联机分析处理技术-数据库系统概论(第五版).doc
数据仓库与联机分析处理技术 数据仓库是为了构建新的分析处理环境而出现的一种数据存储和组织技术。数据仓库概念的创始人 W.H. Inmon 在其《Building the DataWarehouse》一书中列出了操作型数据与分析型数据之间的区别。 数据仓库的定义:数据仓库是一个用以更好地支持企业(或组织)决策分析处理的、面向主题的、集成的、不可更新的、随时间不断变化的数据集合。 数据仓库的基本特征: (1)主题与面向主题:数据仓库中的数据是面向主题进行组织的。主题是一个抽象的概念,是在较高层次上将企业信息系统中的数据综合、归类并进行分析利用的抽象: (2)数据仓库是集成的:数据仓库的数据是从原有的分散的数据库数据中抽取来的,因此数据在进入数据仓库之前必然要经过加工与集成,统一与综合。 (3)数据仓库是不可更新的:数据仓库主要供决策分析之用,所涉及的数据操作主要是数据查询,一般情况下并不进行修改操作。 数据仓库的建立将操作型处理和分析型处理区分开来。传统的数据库技术为操作型处理服务, 数据仓库为分析型处理服务。二者各司其职,泾渭分明。 越来越多的企业认识到数据仓库能够带來效益,逐步在原有数据库基础之上建立起了自己的数据仓库系统。随着大数据时代的来临,数据仓库对于企业决策的支持作用越来越大。由此,数据仓库也成为各大厂商看重并着力发展的业务领域。IBM、Oracle、Teradata 等厂商纷纷采用各种软硬件技术(如 MPP并行处理、列存储等),将其产品扩展到 PB 级数据量。 新兴的互联网企业也在尝试利用一些新技术(如 MapReduce)开发能支持大规模非结构化数据处理的数据仓库解决方案,如 Facebook 在Hadoop 基础上开发出 Hive 系统,用来分析点击流和日志文件。 数据仓库技术是为了满足企业决策分析处理的需求而出现的,它与传统的数据库技术有着明显的区别。数据仓库的建立可以将操作型处理和分析型处理区分开来,从而满足企业的不同需求。
剩余8页未读,继续阅读
- 粉丝: 1
- 资源: 15
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- OpenCV开发资源.txt
- YOLO v3 的 PyTorch 实现,包括训练和测试,并可适用于用户定义的数据集.zip
- 安卓开发学习资源.txt
- yolo v3 物体检测系统的 Go 实现.zip
- YOLO v1 pytorch 实现.zip
- python爱心代码高级.txt
- Yolo for Android 和 iOS - 用 Kotlin 和 Swift 编写的实时移动深度学习对象检测.zip
- Yolnp 是一个基于 YOLO 检测车牌的项目.zip
- Unity Barracuda 上的 Tiny YOLOv2.zip
- Ultralytics YOLO iOS App 源代码可用于在你自己的 iOS 应用中运行 YOLOv8.zip