企业IT架构转型之道——阿里巴巴中台战略思想与架构实战
电子书推荐
-
阿里巴巴-大数据书籍.zip 评分:
该资源包含了《大数据之路一一阿里巴巴大数据实践》, 本书中讲到的阿里巴巴大数据系统架构,就是为了满足不断变化的业务需求,同时实现系统的高度扩展性、灵活性以及数据 展现的高性能而设计的。《大数据大创新——阿里巴巴云上中台之道》,本书通过一名老数据人发自肺腑的分享,帮助尽可能多的有志于大数据构建、应用和创新者,构建自己的数据中台。
上传时间:2019-06 大小:205.44MB
- 315KB
阿里巴巴大数据之路——数据技术篇.pdf
2022-12-24阿⾥巴巴⼤数据之路 阿⾥巴巴⼤数据之路——数据技术篇 数据技术篇 ⼀、整体架构 ⼀、整体架构 从下⾄上依次分为数据采集层、数据计算层、数据服务层、数据应⽤层 数据采集层:以DataX为代表的数据同步⼯具和同步中⼼ 数据计算层:以MaxComputer为代表的离线数据存储和计算平台 数据服务层:以RDS为代表的数据库服务(接⼝或者视图形式的数据服务) 数据应⽤层:包含流量分析平台等数据应⽤⼯具 ⼆、数据采集(离线数据同步) ⼆、数据采集(离线数据同步) 数据采集主要分为⽇志采集和数据库采集。⽇志采集暂略(参考书籍原⽂)。我们主要运⽤的是数据库采集(数据库同步)。 通常情况下,我们需要规定原业务系统表增加两个字段:创建时间、更新时间(或者⾄少⼀个字段:更新时间) 数据同步主要可以分为三⼤类:直连同步、数据⽂件同步、数据库⽇志解析同步 1.直连同步 通过规范好的接⼝和动态连接库的⽅式直接连接业务库,例如通过ODBC/JDBC进⾏直连 当然直接连接业务库的话会对业务库产⽣较⼤压⼒,如果有主备策略可以从备库进⾏抽取,此⽅式不适合直接从业务库到数仓的情景 2.数据⽂件同步 从源系统⽣成数据⽂本⽂件,利⽤FTP等传输⽅式传输⾄⽬标系统,完成数据的同步 为了防⽌丢包等情况,⼀般会附加⼀个校验⽂件 ,校验⽂件包含数据量、⽂件⼤⼩等信息 为了安全起见还可以加密压缩传输,到⽬标库再解压解密,提⾼安全性 3.数据库⽇志同步 主流数据库都⽀持⽇志⽂件进⾏数据恢复(⽇志信息丰富,格式稳定),例如Oracle的归档⽇志 (数据库相关⽇志介绍,参考:) 4.阿⾥数据仓库同步⽅式 1)批量数据同步 要实现各种各样数据源与数仓的数据同步,需要实现数据的统⼀,统⼀的⽅式是将所有数据类型都转化为中间状态,也就是字符串类型。以此来实现数据格式的统⼀。 产品——阿⾥DataX:多⽅向⾼⾃由度异构数据交换服务产品,产品解决的主要问题:实现跨平台的、跨数据库、不同系统之间的数据同步及交互。 产品简介: 开源地址: 更多的介绍将会通过新开随笔进⾏介绍!(当然还有其他主流的数据同步⼯具例如kettle等!) 2)实时数据同步 实时数据同步强调的是实时性,基本原理是通过数据库的⽇志(MySQL的bin-log,Oracle的归档⽇志等)实现数据的增量同步传输。 产品——阿⾥TimeTunnel(简称TT)。TT产品本质是⼀个⽣产者、消费者模型的消息中间件 3)常见问题 1.增量数据与全量数据的合并 主要的场景是数据同步中周期全量同步,对应的解决⽅案是每次只同步变更的数据,然后和上⼀周期合并,形成最新的全量数据(选择此⽅案的原因是绝⼤多 数⼤数据平台不⽀持update操作) 具体的⽅案主要有union的联合操作(可以通过⽣成增量中间表detal)与阿⾥主推的全外连接full outer join+全量覆盖insert overwrite的形式。实例参考如下: SQL的Join语法有很多, inner join(等值连接) 只返回两个表中联结字段相等的⾏, left join(左联接) 返回包括左表中的所有记录和右表中联结字段相等的记录, right join(右联接) 返回包括右表中的所有记录和左表中联结字段相等的记录, 假设我们有两张表。Table A 是左边的表。Table B 是右边的表。其各有四条记录,其中有两条记录name是相同的,如下所⽰: A表 id name 1 Pirate 2 Monkey 3 Ninja 4 Spaghetti B表 id name 1 Rutabaga 2 Pirate 3 Darth Vade 4 Ninja 让我们看看不同JOIN的不同。 FULL [OUTER] JOIN (1) SELECT * FROM TableA FULL OUTER JOIN TableB ON TableA.name = TableB.name TableA.name = TableB.name 的情况,A和B的交集有两条数据,那么 FULL OUTER JOIN的结果集, 应该是2+2+2=6条,即上⾯的交集,再加剩下的四条数据,没有匹配,以null补全。 结果集 (TableA.) (TableB.) id name id name 1 Pirate 2 Pirate 2 Monkey null null 3 Ninja 4 Ninja 4 Spaghetti null null null null 1 Rutabag
- 11.9MB
阿里巴巴大数据实践之路.pdf
2021-10-06阿里巴巴大数据实践之路.pdf
- 7.73MB
阿里巴巴大数据实践之路-9.pdf
2022-06-26阿里巴巴大数据实践之路-9.pdf
- 7.12MB
阿里大数据之路——关键总结版.pdf
2021-11-22阿里大数据之路的自我总结,希望分享给有需要的同学,包含大量自己画的图
- 85.89MB
阿里大数据之路:阿里巴巴大数据实践-339页.zip
2021-09-29阿里大数据之路:阿里巴巴大数据实践-339页
- 16.69MB
阿里巴巴的大数据实战总结大数据实战.zip
2020-08-16阿里巴巴的大数据实战总结,maxcompute,hadoop等。深度剖析淘宝、高德、友盟+、1688、优酷、阿里妈妈、阿里影业大数据实战场景,2020不容错过的企业大数据实战手册
- 538KB
阿里巴巴大数据竞赛.zip
2023-10-22阿里巴巴大数据竞赛.zip
- 577KB
2020122169-大数据201-高萱.zip
2023-06-112020122169-大数据201-高萱.zip
- 877KB
数字大爆炸-大数据时代.zip
2021-12-01数字大爆炸-大数据时代.zip
- 1.39MB
阿里巴巴大数据解决方案.pdf
2015-01-29阿里巴巴大数据解决方案,包括Hadoop集群服务模式、跨机房方方案、ODPS简介
- 2.4MB
阿里巴巴大数据实践之路
2015-11-12云栖大会, 阿里巴巴大数据实践, 介绍了阿里巴巴数据存储,打通,运营过程
- 11.10MB
阿里巴巴大数据实践之路-陈鹏宇.pdf
2021-07-02阿里巴巴大数据实践之路-陈鹏宇.pdf
- 1.53MB
阿里巴巴百家讲坛-大规模离线数据计算-hadoop 高清完整中文版PDF下载
2018-02-26阿里巴巴百家讲坛-大规模离线数据计算-hadoop 高清完整中文版PDF下载
- 697KB
-大数据时代下的新媒体精准营销研究--已改.zip
2021-09-12-大数据时代下的新媒体精准营销研究--已改.zip
- 31KB
参考资料-大数据文献综述.zip
2022-02-18参考资料-大数据文献综述.zip
- 2.94MB
大数据系列2020-大数据面试题.zip
2021-04-28大数据系列2020-大数据面试题.zip
- 1.30MB
实时计算-大数据大会-pub.zip
2021-10-13实时计算-大数据大会-pub.zip
- 557KB
kettle-sdk-plugin-assembly-8.3.0.0-371.zip
2020-08-06pdi-ce-8.3.0.0-371.zip-kettle8.3版本插件SDK包,适用于大数据ETL开发人员进行大数据抽取转换(清洗)加载的一款开源ETL工具,Pentaho DataIntegration,官方可扩展自定义插件模板
- 14.33MB
阿里巴巴大数据智能技术.zip
2021-10-25阿里巴巴大数据智能技术
- 11.69MB
天池大数据竞赛项目--电力预测.zip
2023-10-23天池大数据竞赛项目--电力预测.zip
- 23.28MB
【资料合集】UG220625-北京-大数据Meetup.zip
2022-07-05揭秘大数据架构 -- 从数据服务架构到数据存储架构
- 698KB
-大数据时代下的新媒体精准营销研究--已改-论文.zip
2021-08-18-大数据时代下的新媒体精准营销研究--已改-论文.zip
- 1.0MB
Python基础与大数据应用-习题答案.zip
2022-07-02Python基础与大数据应用-习题答案.zip
- 819.76MB
HCIE-Big Data【大数据】.zip
2020-06-28HCIE-Big Data【大数据】.zip
- 2.79MB
基于python实现用户画像生成系统完整源码-大数据案例分析作业.zip
2023-11-03基于python实现用户画像生成系统完整源码_大数据案例分析作业.zip A User Profile Generation System. 基于python实现用户画像生成系统完整源码_大数据案例分析作业.zip 基于python实现用户画像生成系统完整源码_...
- 78.33MB
javaExcel大数据导出.zip
2018-07-12javaExcel大数据导出.zipjavaExcel大数据导出.zipjavaExcel大数据导出.zip
- 1.21MB
大数据课设.zip
2021-12-07大数据课设.zip
- 19KB
数学建模案例与技术(DUFE大数据实验 课程)--期末课设源码.zip
2024-01-16数学建模案例与技术(DUFE大数据实验 课程)--期末课设源码.zip数学建模案例与技术(DUFE大数据实验 课程)--期末课设源码.zip数学建模案例与技术(DUFE大数据实验 课程)--期末课设源码.zip数学建模案例与技术(DUFE大数据...