没有合适的资源?快使用搜索试试~ 我知道了~
刚进入云计算大数据领域,从初级开始,做大数据ETL开发,那么数据仓库这一块,应该是入门的开始一项技术
资源推荐
资源详情
资源评论
官方网站:www.lt-bi.com QQ群: 127752917 ; 210700527
数据仓库入门教程
II
目录
术语 ............................................................................ 2
数据仓库基础 5
1 相关概念 ..................................................................... 6
1.1 数据仓库 ............................................................. 6
1.2 企业信息工厂 ......................................................... 7
1.3 维 ................................................................... 8
1.4 事实表 .............................................................. 10
1.5 数据集市 ............................................................ 14
1.6 ODS ................................................................. 14
1.7 元数据 .............................................................. 16
1.8 ETL ................................................................. 17
1.9 OLAP ................................................................ 20
2 数据仓库架构 ................................................................ 23
2.1 HWBIS系统架构 ....................................................... 23
3 主流数据仓库产品介绍 ........................................................ 25
3.1 ETL工具 ............................................................. 25
3.2 报表展现工具 ........................................................ 31
3.3 主流数据仓库产品对比分析 ............................................ 41
4 行业案例 .................................................................... 45
4.1 案例1:某通信公司决策分析系统实施案例 ............................... 45
4.2 案例3:大唐电信ODS数据整合案例 ...................................... 49
术语
BI
Business Intelligence,即商业智能,也看到有些媒体里写作商务智能综合企业所有沉淀下来
的信息,用科学的分析方法,为企业领导提供科学决策信息的过程。
BOSS
业务运营支撑系统:BusinessOperationsSupportSystems,简称BOSS
BPM
企业绩效管理
BPM
BUSINESSPERFORMANCEMANAGEMENT(企业绩效管理),是以商业智能(BI)技术、平衡计分卡(BSC)
和个人关键绩效指标(KPIs)等先进信息技术和管理理论为基础的战略管理的工具,在财务、客户、
融通学苑 中国专注于商业智能培训与咨询的领导者
官方网站:www.lt-bi.com QQ群: 127752917 ; 210700527
3
内部流程和学习与发展四个维度上进行综合绩效评测,帮助企业从整体上实现对战略实现过程的
贯彻和控制。
BPR
业务流程重整(BusinessProcessReengineering),指利用数据仓库技术,发现并纠正企业业务
流程中的弊端的一项工作。数据仓库的重要作用之一。
CRM
CustomerRelationshipManagement
客户关系管理。CRM是选择和管理有价值客户及其关系的一种商业策略,CRM要求以客户为中心的
商业哲学和企业文化来支持有效的市场营销、销售与服务流程。
CUBE
立方体
DM(Datamart)
即数据集市,或者叫做“小数据仓库”。如果说数据仓库是建立在企业级的数据模型之上的话。
那么数据集市就是企业级数据仓库的一个子集,他主要面向部门级业务,并且只面向某个特定的
主题。数据集市可以在一定程度上缓解访问数据仓库的瓶颈。
DM(DataMine).
数据挖掘是一个从大型数据库中提取以前未知的,可理解的,可执行的信息并用它来进行关键的
商业决策的过程。
DSS
决策支持系统(DecisionSupportsystem),相当于基于数据仓库的应用。决策支持就是在收集
所有有关数据和信息,经过加工整理,来为企业决策管理层提供信息,为决策者的决策提供依据。
DW
Datawarehouse,本世纪80年代中期,“数据仓库之父”WilliamH.Inmon先生在其《建立数据仓
库》一书中定义了数据仓库的概念,随后又给出了更为精确的定义:数据仓库是在企业管理和决
策中面向主题的、集成的、与时间相关的、不可修改的数据集合。与其他数据库应用不同的是,
数据仓库更像一种过程,对分布在企业内部各处的业务数据的整合、加工和分析的过程。而不是
一种可以购买的产品。
EDM
EnterpriseDataModel企业数据模型
ERP
Enterprise Resourse Planning企业资源规划。它是一个以管理会计为核心的信息系统,识别和
规划企业资源,从而获取客户订单,完成加工和交付,最后得到客户付款。换言之,ERP将企业
内部所有资源整合在一起,对采购、生产、成本、库存、分销、运输、财务、人力资源进行规划,
从而达到最佳资源组合,取得最佳效益。
ETL
数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程。构建
数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的
数据仓库模型,将数据加载到数据仓库中去。
融通学苑 中国专注于商业智能培训与咨询的领导者
官方网站:www.lt-bi.com QQ群: 127752917 ; 210700527
4
KDD
KDD(Knowledge Discovery in Database)数据库中知识发现。是基于数据库的知识发现,指的
是从大型数据库或数据仓库中提取人们感兴趣的知识,这些知识是隐含的、事先未知的、潜在有
用的、易被理解的模式。
KPI
企业关键业绩指标(KPI:KeyProcessIndication)是通过对组织内部流程的输入端、输出端的关
键参数进行设置、取样、计算、分析,衡量流程绩效的一种目标式量化管理指标,是把企业的战
略目标分解为可操作的工作目标的工具,是企业绩效管理的基础。
LDM
逻辑数据模型
MDD
多维数据库(Multi Dimesional Database,MDD)可以简单地理解为:将数据存放在一个n维数组
中,而不是像关系数据库那样以记录的形式存放。因此它存在大量稀疏矩阵,人们可以通过多维
视图来观察数据。多维数据库增加了一个时间维,与关系数据库相比,它的优势在于可以提高数
据处理速度,加快反应时间,提高查询效率。
Metadata
Metadata(元数据),它是“关于数据的数据”在地理空间信息中用于描述地理数据集的内容、质
量、表示方式、空间参考、管理方式以及数据集的其他特征,它是实现地理空间信息共享的核心
标准之一。目前,国际上对空间元数据标准内容进行研究的组织主要有三个,分别是欧洲标准化
委员会(CEN/TC287)、美国联邦地理数据委员会(FGDC)和国际标准化组织地理信息/地球信息技术
委员会(ISO/TC211)。
MOLAP
严格遵照Codd的定义,自行建立了多维数据库,来存放联机分析系统数据的ArborSoftware,开创
了多维数据存储的先河,后来的很多家公司纷纷采用多维数据存储。被人们称为
MuiltDimensionOLAP,简称MOLAP,代表产品有Hyperion(原Arborsoftware)Essbase、
ShowcaseSTRATEGY等。
ODS
(Oprational Data Store)操作型数据存储,对于一些准实时的业务数据库当中的数据的暂时存
储,支持一些同时关连到历史数据与实时数据分析的数据暂时存储区域
融通学苑 中国专注于商业智能培训与咨询的领导者
官方网站:www.lt-bi.com QQ群: 127752917 ; 210700527
5
数据仓库基础
剩余50页未读,继续阅读
资源评论
张教主z
- 粉丝: 0
- 资源: 11
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 技术资料分享CC2530中文数据手册完全版非常好的技术资料.zip
- 技术资料分享CC2530非常好的技术资料.zip
- 技术资料分享AU9254A21非常好的技术资料.zip
- 技术资料分享AT070TN92非常好的技术资料.zip
- 技术资料分享ADV7123非常好的技术资料.zip
- TestBank.java
- js-leetcode题解之146-lru-cache.js
- js-leetcode题解之145-binary-tree-postorder-traversal.js
- js-leetcode题解之144-binary-tree-preorder-traversal.js
- js-leetcode题解之143-reorder-list.js
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功