没有合适的资源?快使用搜索试试~ 我知道了~
Oracle 9i的ETL处理
资源详情
资源评论
资源推荐
Oracle9i 的 ETL 处理
Oracle 白皮书
2001 年 6 月
Oracle
Oracle9i 中的 ETL 处理
运行概要
………………………………………………………………3
Oracle9i
——
商务智能平台…………………………………………3
共同的 ETL 挑战……………………………………………………4
Oracle 怎样改变 ETL 处理…………………………………………5
大多数 ETL 处理在数据库外……………………………………6
为 ETL 处理载入数据库段区域……………………………………7
新范例………………………………………………………………8
Oracle9i 的 ETL 功能………………………………………………8
改变数据的捕获……………………………………………………8
外部表………………………………………………………………9
例子…………………………………………………………10
多表插入…………………………………………………………11
例子……………………………………………………………11
更新和插入功能………………………………………………12
例子……………………………………………………………12
表功能………………………………………………………………13
例子………………………………………………………………14
可传送的表空间……………………………………………………15
可恢复语句…………………………………………………………16
DML 平行操作……………………………………………………16
分区和分区维护操作………………………………………………16
结论……………………………………………………………………17
Oracle9i 的 ETL 处理 第 2 页
Oracle9i 内的 ETL 处理
运行概要
Oracle8i 是用于数据仓库的主流关系数据库。Oracle 取得成功是因为
它关注数据仓库的基本和核心要求:性能、可伸缩性和可管理性。数
据仓库存储更大的数据、支持更多用户、要求更高的性能,这些关键
要求成为数据仓库成功实施的重要因素。
然而,Oracle9i 远远超过其在功能、可伸缩性和可管理性方面的核心
要求,它代表了第一个真正的商务智能平台。现今的许多数据仓库都
使用关系型数据库,主要用于管理数据、进行基本查询。这些操作是
数据仓库的基础,但 Oracle9i 拓宽了数据仓库中关系型数据库的领
域,因此 Oracle9i 对数据仓库中所有的数据操作都是可伸缩的数据
引擎,而不仅仅限于载入和基本的查询操作。Oracle9i 在以下三方面
提供了新的服务器功能:分析能力、ETL(提取、转换、加载)和数
据挖掘。
该白皮书提供了 Oracle9i 的 ETL 功能概要,描述了在利用
Oracle9i 作为 ETL 的传送引擎的条件下,此数据库新功能如何重新
定义 ETL 数据流动和转换的实施方式。其它任务对成功实施 ETL
也是非常重要的,例如 Oracle 的 Oracle Warehouse Builder 解决方
案提出的调度、监控和维护等,但这些已超出了白皮书的范畴。
Oracle9i
—
商务智能平台
Oracle9i 在提供企业级的性能、可伸缩性和可管理性方面继续独占业
界鳌头,并且在这些领域提供许多新特性。不过,Oracle9i 还拓宽了
用于数据仓库的关系数据库的功能。
Oracle9i 是业界第一个商务智能平台。数据仓库平台的优势是整合,
尤其是数据的整合。这样,对包含大量数据处理的任务,可以统筹利
用同一服务器的基础设施。
Oracle9i 的 ETL 处理 第 3 页
为了满足商务智能平台的要求,Oracle 扩展了数据库功能和数据库
语言 (SQL)。Oracle9i 的关系特性并不意味着,关系型数据库是
OLAP、数据挖掘或 ETL 的完全解决方案;但是,这些特性的确为
上述每项功能运行大量数据提供完整的服务器基础设施。
共同的 ETL 挑战
与 ETL 有关的术语和任务已为人熟知多年,并且几乎不是数据仓库
环境特有的:大量专有应用程序和数据库系统构成了企业的 IT 主干
网。应用程序或系统中的数据必须共享以利于集成。这样所有应用程
序的数据(至少一部分)显示相同。数据共享通常由类似于今天我们
称做 ETL 的机制。
由于更多的负载,数据仓库环境面临同样的挑战。对于这些负载,数
据仓库环境不仅要交换,在许多系统中还要集成、重新安排和合并数
据,因而为商务智能提供了新的一体化信息。此外,数据仓库环境中
的数据量很大。
ETL 处理中发生了什么?在提取过程中,所需数据须经识别,然后
从多种不同数据源,包括数据库系统和应用程序中提取。通常,指定
具体的所需数据子集是不可能的。既然在下一时间点将进行相关数据
的识别,因此提取的数据要多于所需数据。依靠源系统的功能(例如,
OS 资源),一些转换可能在提取过程中发生。提取数据的大小,根
据源系统和业务状况,从几千字节到几兆字节变化。正如数据提取大
小可能广泛变化,数据提取频率也可能广泛变化:时间跨度在天/小
时和秒之间变化,甚至接近实时。
例如网络服务器日志文件可以轻易地在短时间内成为兆字节,因此必
须频繁地提取。
提取数据后,该数据在物理上必须转到目标系统或媒介系统以便进一
步处理。根据所选择的传送机制,在此过程中必须进行一些转换。例
如,一个通过网关直接访问远程目标的 SQL 语句,可使用标准的
SQL 过程进行传送(一个简单的例子是把两列连接为 SELECT 的一
部分)。
Oracle9i 的 ETL 处理 第 4 页
剩余17页未读,继续阅读
gxgabc
- 粉丝: 0
- 资源: 5
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0