没有合适的资源?快使用搜索试试~ 我知道了~
数据中台技术选型最佳实践.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
5星 · 超过95%的资源 2 下载量 190 浏览量
2022-06-13
00:21:50
上传
评论
收藏 448KB DOCX 举报
温馨提示
试读
30页
数据中台技术选型最佳实践.docx数据中台技术选型最佳实践.docx数据中台技术选型最佳实践.docx数据中台技术选型最佳实践.docx数据中台技术选型最佳实践.docx数据中台技术选型最佳实践.docx数据中台技术选型最佳实践.docx数据中台技术选型最佳实践.docx
资源推荐
资源详情
资源评论
数据中台技术选型最佳实践
1
目 录
一、大数据演进,从数据仓库到数据中台 .......................................................................................... 3
二、数据中台架构与技术选型 ............................................................................................................... 8
三、数据研发实践 ................................................................................................................................... 13
2
一、大数据演进,从数据仓库到数据中台
第一阶段
21 世纪的第一个 10 年,企业级数据仓库 (EDW )从萌芽到蓬勃发展, “IOT ”( IBM 、Oracle 、
Teradata) 占领了大部分市场,提供数据仓库建设从硬件、软件到实施的整体方案。
这个时代的数据仓库实施不仅需要购买大 (中、小)型机,配套商用的关系型数据库 ( Oracle 、
DB2 、SQL Server )以及一些 ETL/OLAP 套件,实施成本相对高昂,数据仓库建设主要集中在
金融、电信、大型零售与制造等行业。
数据仓库的应用主要通过为企业提供报表、分析等数据,辅助企业的经营决策。像电信行业的
经营分析系统、银行的风控管理等,都是这个期间比较典型的应用。
第二阶段
Bigdata( 大数据 )的发展。其中
Hadoop 分布式的计算框架,
3
数据湖的概念也是这个阶段诞生(主要是为降低传统数仓较为复杂的中间建模过程,通过接入
业务系统的原始数据,包括结构化、非结构数据,借助 hadoop 生态强大计算引擎,将数据直
接服务于应用)。这个阶段不只是金融、电信这些行业,国内主流互联网企业也纷纷搭建起大
数据平台。
大数据应用更为丰富, 不仅限于决策分析, 基于 APP/ 门户站点的搜索推荐、 以及通过 A/B Test
来对产品进行升级迭代等是这个阶段常规的应用点,用户画像在这个阶段也得到重视,主要应
用于企业的营销、运营等场景。
4
10 多年不断的技术积累,
其核心思想是数据流转的所有环节进行统一化,如从采集到存储到加工等过程,在这些过程中
通过建立统一的公共数据模型体系、统一的指标与标签体系,提高数据的标准性、易用性,让
数据本身更好地连通,提升使用效率。
2)工具组件化
数据在采集、计算、存储、应用过程中涉及多业务线条,多场景,将这些场景与工具(采集工
具、管道工具、计算 &调度工具、数据服务工具,数据管理工具、可视化工具等)进行沉淀,
研发出通用、高效的组件化工具,避免重复开发,降低研发成本。
5
剩余29页未读,继续阅读
资源评论
- xuyingzhong2022-07-19资源内容总结的很到位,内容详实,很受用,学到了~
- 阿泰2024-01-30资源内容详细全面,与描述一致,对我很有用,有一定的使用价值。
苦茶子12138
- 粉丝: 1w+
- 资源: 6万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功