dm-ch1資料倉儲與資料採掘概述
隨著資訊技術的不斷推廣和應用,許多企業都已經 在使用管理資訊系統(MIS)處理管理交易和日常業 務。這些管理資訊系統為企業累積了大量的資訊 因此,在資訊處理中,產生了與傳統資料庫有很大 差異的資料環境要求,和從這些巨量資料中獲取特 殊知識的工具的需要。 【资料仓库与数据挖掘概述】 随着信息技术的普及和应用,企业管理信息系统(MIS)已成为处理管理交易和日常业务的关键工具,这些系统积累了大量的信息。在这样的背景下,对数据环境的需求和从海量数据中提取有价值信息的工具变得越来越重要,这与传统的数据库处理方式大不相同。 1.1 资料仓库的发展与展望 传统的数据库主要存储当前的业务处理信息,缺乏决策分析所需的大量历史数据。为满足管理层的决策分析需求,资料仓库(Data Warehouse, DW)应运而生。资料仓库是一个专门设计用于支持决策分析的系统,它整合了来自多个源的数据,提供了历史的、稳定的视角,便于管理层进行深入的洞察。 1.1.1 从传统数据库到资料仓库 - 决策处理的系统响应问题:在交易处理系统中,要求快速响应和频繁的数据访问,而决策分析则需要大量资源,这对实时交易处理系统是难以承受的。 - 决策数据需求的问题:决策分析需要全面、准确的集成数据,包括内部各部门和外部的信息。传统数据库仅存储部门内交易数据,无法提供必要的整合信息。 - 数据混乱问题:不同系统间的数据表示和结构可能不一致,需要进行数据清洗和转换,以便正确理解数据含义。 - 资料的连续萃取形成复杂的“蜘蛛网”结构,需要有效管理和整合。 1.1.2 资料仓库的定义与基本特征 William H. Inmon在1993年的著作中定义资料仓库为一个主题导向的、集成的、随时间变化的、不可丢失的数据集合,用于支持管理层的决策过程。资料仓库的特点包括: - 主题导向:关注特定的决策分析领域。 - 集成:将来自不同源的数据整合为一致视图。 - 随时间变化:存储历史数据,反映数据的变化趋势。 - 不易丢失:确保数据的稳定性和一致性。 - 支持决策:提供商业智能(BI)工具,方便用户进行复杂的数据分析。 1.2 资料仓库的架构与参照结构 资料仓库的架构通常包括数据抽取、转换和加载(ETL)过程,数据仓库本身,以及前端的查询和分析工具。参照结构是指数据在仓库中的组织方式,通常按照业务主题进行分层,如事实表和维度表。 1.3 资料採礦技术 资料採礦是通过算法从大量数据中发现模式、关联和趋势的过程,包括分类、聚类、关联规则学习等方法。这些技术可以帮助企业发现隐藏的市场趋势、客户行为模式等。 1.4 資料倉儲與資料採礦的應用 资料仓库和数据挖掘的应用涵盖了各个行业,如市场分析、风险管理、客户服务优化、供应链管理等。它们帮助企业提高决策效率,发现新的商业机会,并优化业务流程。 资料仓库与数据挖掘是现代企业获取竞争优势的重要手段,通过集成、分析和挖掘海量数据,可以为企业决策提供强有力的支持。随着技术的进步,这一领域将持续发展,为企业带来更多的价值。
- 粉丝: 0
- 资源: 3
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助