没有合适的资源?快使用搜索试试~ 我知道了~
数据仓库:业务模型分析与设计步骤
5星 · 超过95%的资源 需积分: 47 97 下载量 123 浏览量
2008-12-22
09:21:16
上传
评论 3
收藏 1.31MB DOC 举报
温馨提示
试读
16页
数据仓库:业务模型分析与设计数据仓库:业务模型分析与设计数据仓库:业务模型分析与设计数据仓库:业务模型分析与设计
资源推荐
资源详情
资源评论
4 业务模型分析与设计
4.1 银行卡业务分析
4.1.1 业务概况分析
作为信息化步伐走得比较快的一个行业,银行在业务系统不断完善的同时,数
据大集中的趋势也展示了数据对于银行的核心地位,同时各大银行之间日趋激烈的
竞争态势也使得银行迫切需要通过数据仓库技术利用其多年积累的数据,借此分析、
挖掘出能为客户提供更好服务的项目,辅助决策,提升银行的竞争力。
银行卡是商业银行向社会公开发行,具有消费信用、转账结算、存取现金等全
部或部分功能,作为结算支付工具的各类卡的统称。是商业银行签发的允许信用良
好者据以赊购(Buy by credit) 商品和劳务的身份证明卡(信用凭证)。银行卡包
括信用卡和借记卡。按币种不同分为人民币卡和外币卡,按发行对象不同分为单位
卡(商务卡)和个人卡,按信息载体不同分为磁条卡,芯片(IC)卡。信用卡按是
否向发卡银行交存备用金分为贷记卡、准贷记卡两类。借记卡按功能不同分为转账
卡(含储蓄卡)、专用卡和储值卡。借记卡不具备透支功能。
银行卡业务作为银行的核心业务之一,在长期运行的过程中积累了大量数据,
但是却没有得到充分有效的利用,造成数据资源的浪费。随着银行卡发行量的增大
及竞争的日益激烈,各银行迫切需要利用这些宝贵的历史数据,对其进行具体而有
针对性的分析和挖掘,以期从中发现有价值的知识,用来辅助决策,提高自身的竞
争力。然而,传统的银行卡业务系统主要用于事务处理,对分析处理的支持并不令
人满意。主要问题体现在:(1)数据量大,处理工作繁重,手工处理数据准确性差;
(2)数据衔接容易出错,纠错难度大;(3)各级卡部间传送数据不能按质按时上报;
(4)统计分析数据资料困难。要提高分析和决策的效率和有效性,必须把分析型数
据从事务处理环境中提取出来,建立单独的分析型环境,在此基础上进行分析挖掘,
辅助决策支持。数据仓库﹑OLAP 及数据挖掘技术的出现为解决这一问题提供了有
效的途径。
银行卡决策支持系统采用数据转换服务(DTS)技术将积聚于商业银行银行卡数
据库中各种数据集中起来,经过清洗以后,应用数据仓库(DW)技术进行存储、组
合、分析、分类,构建数据立方体。再运用联机分析(OLAP)和数据挖掘(DM)技术,
根据对持卡人的职业、年龄、单位、客户相互之间的关系等基本的个人信息,持卡
人的存款余额、存款发生额、存款笔数、取款发生额、取款笔数、交易金额、交易
笔数信息,和银行方面的存款金额,发卡量、黑名单信息、网点信息等数据的综合,
可以建立多种业务需要的分析模型,对应到数据仓库中即为各个主题。如果对这些
主题再进行分类,可以将它们归入一些特定的数据集市。比如根据持卡人的个人信
息和消费信息,可以建立基于时间序列的持卡人消费模型,并根据预测算法对各种
持卡人下一步的消费总量进行预测;根据对持卡人个人信息和存款余额、交易信息
以及止付、黑名单信息,建立持卡人信用分析模型;并依据专家对典型持卡人透支
行为的判定意见,采用分类算法,建立持卡人透支行为特征判定模型;根据保本交
易笔数、客户营运收入、每笔交易所需成本等指标分析,发掘出盈利客户、保本客
户、潜力客户及亏损客户四类客户的特征参数,建立客户分析模型。
第 1 页 共 16 页
本文以某银行银行卡业务系统为应用背景,综合运用数据仓库﹑OLAP 及数据
挖掘技术建立了银行卡决策支持系统,为银行卡管理人员提供有力的决策支持。
4.1.2 源数据库结构分析
银行卡源数据结构
[46]
如图 6 和图 7 所示,分为逻辑模型和物理模型,在这里我
们重点讨论逻辑模型,并且只给出对本数据仓库系统中重点涉及到的一些库表,而
对于其他系统内的字典表和各种辅助表格不一一分析介绍。库表结构来源于银行卡
系统中的实际后台数据库。我们在这里利用数据库建模工具 ERWin4.0 对其表结构
进行了逆向工程,得到了图 6 所示的结构。这个银行卡数据库也是我们进行数据仓
库建立的数据源。
图 6 中客户信息表(CIPST)是管理客户个人信息的表格。主键为客户编号
(CUNB)。在同一主机所在地,任意储户凭同一证件只能开设唯一客户号,由该
客户号统一管理该客户在本系统内所有账户。
借记卡资料表(DDMTT)和信用卡资料表(CDMTT)记录了银行卡的信息。
其中主键均为卡号。这两个表在业务系统中被分开,减轻业务系统的负担。由于其
主要字段基本相同,为了建立数据仓库方便起见,在数据分析、清洗阶段这两个表
被合并成银行卡资料表(MDMTT),主键仍为客户编号,数据来自于前面的借记
卡资料表(DDMTT)和信用卡资料表(CDMTT)。银行卡资料表中增加字段:
卡交易类型(MDTP,char(1)),用来标记借记卡(0)和信用卡(1)。客户信息
表通过客户编号和借记卡资料表、信用卡资料表连接,为 1:n 的关系。
第 2 页 共 16 页
Figure 6 Logic Model of Source Database
图 6 逻辑结构
备用金主文件表(RESAT)是描述银行卡的账务信息的表,主键为卡号
(CDNO)。这个表中的记录和借记卡资料表(DDMTT)和信用卡资料表
(CDMTT)表中的记录一一对应,所不同的是该表记录的是涉及开户、销户信息、
余额、利息信息的。借记卡资料表(DDMTT)和信用卡资料表(CDMTT)通过
卡号和该表相连,关系为 1:1。
消费明细表(RESDT)是记录所有卡交易明细的表,主键为交易日期
(TRDT)和当日记账顺序号(SQNB)。该表记录持卡人在何时、何地发生了何
种交易,交易金额是多少,何时记账。所以一笔明细中至少应该包括以下几方面信
息:
(1) 交易地点信息,由以下几部分组成:
A) 银行系统标志(BBMK)
B) 中心代号(SCCD)
C) 交易地点类型(TTYP)
D) 商户编号(SPCD)+POS 号(PSID)
(2) 交易时间信息:交易日期(TRDT)
(3) 交易金额信息:交易金额(TRAM)
(4) 交易信息:包括业务代号(OTCD)、交易代码(TRCD)、摘要代码
(DGCD)。
在消费明细表中,卡卡转账和卡、储蓄间的转账这样涉及两个账户的交易,应
记录两笔明细,一个记转入的,另一个记转出的。
该表中需要注意的几个字段是交易金额(TRAM)和账户余额(ACBL),这
两个字段记录了金额的数目,该表记录的是交易细节。备用金主文件表
(RESAT)通过字段账号(ACNO)与该表相连,为 1:n 的关系。
网点表(PMBBT)为各网点(储蓄机构)的信息表,主键为机构代号
(OGCD)。该表记录了各网点的详细信息,该表在后台维护,同时必须保证相应
表之间的完整性。网点表(PMBBT)通过机构代号(OGCD)和消费明细表
(RESDT)相连,关系为 1:n。
第 3 页 共 16 页
Figure 7 Phisical Mode of Source Database
图 7 物理结构
柜员表(PMTLT)是描述柜员信息的表,主键为柜员代号(TLNO)。业务系
统中大部分联机交易均由临柜柜员操作,则柜员的管理必然形成系统中重要的一环。
在初建网点时通过中心主机维护主管柜员,而其他所有柜员信息则通过联机交易由
主管柜员进行维护。网点表(PMBBT)通过机构代号(OGCD)和柜员表连接,
关系为 1:n。
银行卡摘要表(CMDGT)是描述银行卡有关交易类型的表格,主键为摘要
代码(DGCD)。字段说明(DSCP)中描述了具体的交易类型。该表为字典表,
通过摘要代码和消费明细表(RESDT)相连。
4.2 银行卡数据仓库设计
4.2.1 元数据的设计
元数据是关于数据的数据,是对数据的结构、内容、键码、索引等信息的描述
[6]
。元数据是数据仓库的神经中枢,用于管理和控制数据仓库的建立和维护
[6][47]
。
元数据主要用来存储企业的业务模型和数据模型
[10]
,是数据信息化的核心部件。在
数据库中,元数据即是数据字典,用来描述数据库中的对象,包括表、列、数据库、
规则等。在数据仓库中,元数据用于描述数据仓库对象的任何东西——无论是一个
表、一个列、一个查询、一个商业规则等。如何构建元数据及实现高效的元数据管
理,在一个成功的数据仓库系统中是必不可少的。也正是由于有了元数据,DSS
分析人员才能有效地利用数据仓库。
元数据的重要性表现在
[6]
:(1)数据仓库使用者往往将使用元数据作为分析的第
一步,元数据如同数据指示图;(2)从操作性数据环境到数据仓库的数据转换是复
杂的、多方面的,是关键步骤。元数据要包含对这种转换的清晰描述,保证这种转
换是正确、适当和合理的,并且是灵活可变的;(3)元数据还管理粒度划分、主题
建立以及抽取的更新周期等,以便管理好数据仓库中大规模数据。
所以在数据仓库的建立之初,首先要确定元数据。元数据库中记载了关于数据
仓库,数据源,维,维级,维成员,立方体,立方体指标,立方体维,虚拟立方体,
虚拟立方体维,虚拟立方体指标的信息。下面列举了部分元数据表结构:
A. TDataWare:(数据仓库元数据表)
(
id int identity(1,1),
name varchar(40),
ModelId int,
Description varchar(200)
)
B. TCube:(立方体元数据表)
(
id int identity(1,1),
Name varchar(60),
Type int,
DatawareId int,
ModelId int,
EstimatedRows int,
第 4 页 共 16 页
剩余15页未读,继续阅读
资源评论
- 阿泰2018-01-28很不错,理论、实践非常清晰
hudeping
- 粉丝: 8
- 资源: 15
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功