没有合适的资源?快使用搜索试试~ 我知道了~
数据治理-DAMA.pdf
资源推荐
资源详情
资源评论
概述
DAMA International很高兴发布第二版DAMA数据管理知识体系指南(DAMA-DMBOK2)。自
2009年第一版发布以来,数据管理领域取得了重大进展。数据治理已成为许多组织的标准结构,新技术
已使“大数据”(各种格式的半结构化和非结构化数据)的收集和使用成为可能,并且数据道德的重要性
也随着我们探索和利用日常生活中产生的大量数据和信息的能力。
这些变化是令人兴奋的。他们也对我们的职业提出了新的和不断增长的要求。 DAMA通过重新构造
DAMA数据管理框架(DAMA车轮),增加了细节和澄清并扩大了DMBOK的范围来应对这些变化:
改进和更新了所有知识领域的上下文图。
数据集成和互操作性已添加为新的知识领域,以突出其重要性(第8章)。
由于越来越需要在数据管理的各个方面采用道德方法(第2章),因此将数据道德作为单独的一章
进行了介绍。
治理的作用已被描述为功能(第3章)以及与每个知识领域有关。
组织变更管理也采用了类似的方法,这在第17章中进行了介绍,并已并入“知识区”各章中。
有关大数据和数据科学(第14章)和数据管理成熟度评估(第15章)的新章节可帮助组织了解他
们想去哪里,并为他们提供到达那里的工具。
第二版还包括一组新制定的数据管理原则,以支持组织有效管理其数据并从其数据资产中获取价值
的能力(第1章)。
我们希望DMBOK2将为全球的数据管理专业人员提供宝贵的资源和指南。尽管如此,我们也认识
到这仅仅是一个起点。真正的进步将随着我们的应用和从这些思想中学习而来。 DAMA的存在是通过共
享想法,趋势,问题和解决方案来使成员不断学习。
苏·古恩斯·劳拉·塞巴斯蒂安·科尔曼
总统出版物主任
DAMA国际 DAMA国际
第一章 数据管理
1. 介绍
许多组织认识到他们的数据是至关重要的企业资产。数据和信息可以使他们了解其客户,产品和服
务。它可以帮助他们创新并达到战略目标。尽管认识到这一点,但很少有组织将数据作为资产来管理,
从而可以从中获得持续的价值(Evans和Price,2012)。从数据中获取价值并非凭空或偶然发生的。它
需要意图,计划,协调和承诺。它需要管理和领导。
数据管理是对计划,策略,程序和实践的开发,执行和监督,可在其整个生命周期内交付,控制,
保护和提高数据和信息资产的价值。
数据管理专业人员是从事数据管理的各个方面(从整个生命周期的数据技术管理到确保数据得到适
当利用和利用)来满足战略组织目标的任何人。数据管理专业人员担当着各种角色,从技术含量高(例
如数据库管理员,网络管理员,程序员)到战略业务(例如Data Stewards,Data Strategists,首席数
据官)。
数据管理活动范围广泛。它们包括一切,包括就如何从数据中获得战略价值做出一致决策的能力,
到数据库的技术部署和性能。因此,数据管理需要技术和非技术(即“业务”)技能。必须在业务和信息
技术角色之间分担管理数据的责任,并且这两个领域的人员必须能够协作以确保组织拥有满足其战略需
求的高质量数据。
在组织为了获得未来价值而进行投资的意义上,数据和信息不仅仅是资产。数据和信息对于大多数
组织的日常运营也至关重要。它们被称为信息经济的“货币”,“生命之血”,甚至是“新油”。1无论组织是
否从其分析中获得价值,如果没有数据,它甚至无法开展业务。
为了支持从事这项工作的数据管理专业人员,DAMA International(数据管理协会)已出版了本
书,即DAMA数据指南第二版。该版本以第一个版本(于2009年出版)为基础,该版本提供了随着该行
业的发展和成熟而建立的基础知识。
本章概述了一组数据管理原则。 它讨论了与遵循这些原则有关的挑战,并提出了应对这些挑战的
方法。 本章还描述了DAMA数据管理框架,该框架为数据管理专业人员在各个数据管理知识领域内开展
的工作提供了背景。
1.1 业务驱动因素
信息和知识是获得竞争优势的关键。 与没有数据或数据不可靠的组织相比,拥有可靠,高质量的
客户,产品,服务和运营数据的组织可以做出更好的决策。 无法管理数据类似于无法管理资金。 这导
致浪费和失去机会。 数据管理的主要驱动力是使组织能够从其数据资产中获取价值,就像对财务和实物
资产的有效管理使组织能够从这些资产中获取价值一样。
1.2 目标
在组织内部,数据管理目标包括:
• 了解并支持企业及其利益相关者(包括客户,员工和业务合作伙伴)的信息需求
• 捕获,存储,保护并确保数据资产的完整性
• 确保数据和信息的质量
• 确保利益相关者数据的隐私性和机密性
• 防止未经授权或不当访问,操纵或使用数据和信息
• 确保可以有效地使用数据为企业增值
2. 基本概念
2.1 数据
对数据的长期定义强调了它在表示有关世界的事实中的作用。2在信息技术方面,数据也应理解为
以数字形式存储的信息(尽管数据不仅限于已数字化的信息和数据管理原则适用于纸上以及数据库中捕
获的数据。不过,由于今天我们可以通过电子方式捕获大量信息,因此我们将许多东西称为“数据”,而
在以前这些东西就不会被称为“数据”,例如姓名,地址,生日,周六晚餐吃的东西等。最近购买的一本
书。
关于个人的这些事实可以被汇总,分析,并用于获利,改善健康状况或影响公共政策。此外,我们
的技术能力可以衡量各种事件和活动(从“大爆炸”的影响到我们自己的心跳),以及收集,存储和分析
以前不视为数据的事物的电子版本(视频,图片) ,录音,文档)已经接近我们将这些数据合成为可用
信息的能力。3要利用各种数据而又不被其数量和速度所困扰,就需要可靠,可扩展的数据管理实践。
大多数人认为,由于数据代表事实,因此它是关于世界的一种真理形式,并且事实可以融合在一
起。但是“事实”并不总是简单或直接的。数据是一种表示方式。它代表着自身以外的东西(Chisholm,
2010)。数据既是对它表示的对象的解释,也是必须被解释的对象(Sebastian-Coleman,2013)。
这是说我们需要上下文才能使数据有意义的另一种说法。上下文可以看作是数据的表示系统;这样的系
统包括通用词汇表和组件之间的一组关系。如果我们知道这样一个系统的约定,那么我们就可以解释其
中的数据。4这些约定通常记录在称为元数据的特定类型的数据中。
但是,由于人们通常会在表示概念方面做出不同的选择,因此他们会以不同的方式表示相同的概
念。从这些选择中,数据呈现出不同的形状。想一想我们必须代表日历日期的方式范围,这个概念有一
个公认的定义。现在考虑更复杂的概念(例如客户或产品),其中需要表示的内容的粒度和细节级别并
不总是不言而喻的,表示的过程也变得越来越复杂,管理信息的过程也越来越复杂随着时间的推移。
(请参阅第10章)。
即使在一个组织内,通常也可以通过多种方式来表示同一个想法。因此,需要数据体系结构,建
模,治理和管理以及元数据和数据质量管理,所有这些都可以帮助人们理解和使用数据。在整个组织
中,多重性问题成倍增加。因此,需要可以为数据带来更多一致性的行业级数据标准。
组织始终需要管理其数据,但是技术的变化已经改变了人们对什么是数据的理解,从而扩大了这种
管理需求的范围。 这些变化使组织能够以新的方式使用数据来创建产品,共享信息,创建知识并提高组
织的成功率。 但是,技术的飞速发展以及人类产生,捕获和挖掘有意义的数据的能力,加剧了有效管理
数据的需求。
2.2 数据和信息
数据和信息之间的关系流了很多墨水。 数据被称为“信息的原始材料”,信息被称为“上下文中的数
据”。5通常,分层金字塔用于描述数据(基础),信息,知识和智慧(基础知识)之间的关系。 非常
高)。 虽然金字塔有助于描述为什么需要对数据进行良好管理,但这种表示形式对数据管理提出了一些
挑战。
• 基于仅存在数据的假设。 但是数据并不简单地存在。 必须创建数据。
• 通过描述从数据到智慧的线性序列,它无法认识到首先需要知识来创建数据。
• 这意味着数据和信息是分开的事物,而实际上,这两个概念是相互交织并相互依赖的。 数据是
信息的形式,而信息是数据的形式。
在组织内,为了清楚地交流不同利益相关者对不同用途的需求和期望,在信息和数据之间划一条界
限可能会有所帮助。 (“这是上一季度[信息]的销售报告。它基于我们数据仓库[data]的数据。下一个季
度这些结果[数据]将用于生成我们的季度业绩指标[信息] ]”)。 认识到需要为不同目的准备数据和信
息,这成为数据管理的中心宗旨:数据和信息都需要管理。 如果将两者结合使用和客户要求进行管理,
那么两者的质量都会更高。 在整个DMBOK中,这些术语将互换使用。
2.3 数据作为组织资产
资产是一种经济资源,可以拥有或控制,并拥有或产生价值。 资产可以转换为货币。 尽管人们仍
在理解将数据作为资产进行管理的含义,但数据已被广泛认为是企业资产。 在1990年代初期,一些组
织发现商誉的价值是否应赋予货币价值值得怀疑。 现在,“商誉价值”通常显示为损益表(P&L)中的一
项。 同样,虽然没有被普遍采用,但数据货币化变得越来越普遍。 不久之后,我们就将其视为损益表
的功能。 (请参阅第3章。)
当今的组织依靠其数据资产来制定更有效的决策和更有效地运作。企业使用数据来了解其客户,创
建新产品和服务以及通过削减成本和控制风险来提高运营效率。政府机构,教育机构和非营利组织也需
要高质量的数据来指导其运营,战术和战略活动。随着组织越来越依赖数据,可以更加清楚地确定数据
资产的价值。
许多组织将自己定位为“数据驱动”。旨在保持竞争力的企业必须停止根据直觉或本能做出决策,而
应使用事件触发器并应用分析来获得可行的见解。以数据为驱动力包括这样的认识,即必须通过业务领
导和技术专长的合作,对数据进行有效管理并遵循专业纪律。
此外,当今的业务发展步伐意味着变革不再是可有可无的。数字化破坏是常态。为了对此做出反
应,企业必须与技术数据专业人员一起与业务线同行共同创建信息解决方案。他们必须计划如何获取和
管理他们知道支持业务战略所需的数据。他们还必须摆正自己的位置,以利用机会以新方式利用数据。
2.4 数据管理原则
数据管理与其他形式的资产管理具有相同的特征,如图1所示。它涉及知道组织拥有什么数据以及
可以用它完成什么,然后确定如何最好地使用数据资产来实现组织目标。
像其他管理流程一样,它必须平衡战略和运营需求。 遵循一系列确认数据管理的显着特征并指导
数据管理实践的原则,可以最好地实现这种平衡。
• 数据是具有独特属性的资产:数据是资产,但它在影响管理方式的重要方面与其他资产不同。
这些属性中最明显的是,数据在使用时不会被消耗,金融和实物资产也一样。
• 数据的价值可以并且应该以经济术语表示:将数据称为资产意味着它具有价值。虽然有测量数
据定性和定量值的技术,但尚无用于测量数据的标准。希望对其数据做出更好决策的组织应开发出一致
的方法来量化该价值。他们还应该衡量低质量数据的成本和高质量数据的收益。
• 管理数据意味着管理数据的质量:确保数据适合目的是数据管理的主要目标。为了管理质量,
组织必须确保他们了解利益相关者对质量的要求,并根据这些要求衡量数据。
• 它需要元数据来管理数据:管理任何资产都需要拥有有关该资产的数据(员工人数,会计代码
等)。用于管理和使用数据的数据称为元数据。因为无法保存或触摸数据,所以要了解数据的含义和使
用方法,需要以元数据的形式进行定义和知识。元数据源自与数据创建,处理和使用相关的一系列过
程,包括体系结构,建模,管理,治理,数据质量管理,系统开发,IT和业务运营以及分析。
剩余373页未读,继续阅读
资源评论
weixin_44691090
- 粉丝: 0
- 资源: 1
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Python 程序语言设计模式思路-行为型模式:策略模式:将算法封装成独立的类,并使它们可以互相替换及支付模式数据压缩
- main.py
- Last Loaded Test.DBK
- Screenshot_20240520_163011.jpg
- ubuntu-python3-whisper-tornado docker镜像 Dockerfile
- ubuntu-python3-whisper-tornado docker镜像07
- 新录音 8.m4a
- ubuntu-python3-whisper-tornado docker镜像
- ubuntu-python3-whisper-tornado docker镜像
- ubuntu-python3-whisper-tornado docker镜像09
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功