基于高质量数据架构的数据分析——郑保卫:ENCORE技术总监_IT168文库1
数据驱动的世界正在快速发展,郑保卫博士在SACC2013会议中强调了数据分析的必要性和未来发展方向。数据分析不再仅仅是提供服务的手段,而是成为提供终身制服务的关键。随着信息系统的角色变化,数据分析的重要性日益凸显,特别是在PHR(个人健康记录)等领域的应用。 在数据分析系统构建的战略中,有两个主要方向。数据分析系统的构建应朝向集成化和长期化,这意味着将来自在线交易系统、渠道、客服中心、市场等多个来源的数据整合到企业数据仓库(EDW)中。EDW的概念架构描绘了如何通过中央集中的方式处理和分析这些数据,以生成准确且需求匹配度高的高质量信息。这涉及到将渠道、客服、市场、合同、销售管理等多个部门的数据进行融合。 构建数据分析系统的核心在于数据本身以及确保成功的要素。数据质量是基础,需要关注数据的整合技术,如模型的构建和多维模型设计。多维建模是常用的方法,包括主题域设计、维定义、事实定义以及性能优化。例如,可以采用雪花模型或星型模型,前者数据重复性小,便于变更,但随着表连接增加可能影响性能;后者查询速度快,但需要更多存储空间且变更困难。 在设计数据模型时,要选择合适的事实表和维度表,创建概要表以提高查询效率,并确保数据完整性。位图索引可用于减少数据变更频繁的表的性能问题,同时避免过度依赖视图,以防止管理和性能挑战。 此外,数据主题域设计是数据架构的关键部分。主题域是根据数据固有属性而非业务流程分类的数据集合,它反映了企业的核心业务领域,如客户、产品、销售、市场等。通过对这些主题域的有效管理和设计,企业能够更好地理解和利用其数据资产,从而驱动决策和业务增长。 数据分析在当今的数字化世界中扮演着至关重要的角色。从数据的收集、整合到分析和应用,都需要精心设计的数据架构来支撑。通过多维度建模和合理的数据主题域设计,企业可以构建出高效的数据分析系统,以满足不断变化的业务需求并推动服务的终身制提供。
剩余28页未读,继续阅读
- 粉丝: 1001
- 资源: 298
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
评论0