Greenplum:从大数据战略到实现
作者:冯雷 姚延栋 高小明 杨瑜
出版社:机械工业出版社
ISBN:9787111632160
VIP会员免费
(仅需0.8元/天)
¥ 60.0
温馨提示: 价值40000元的1000本电子书,VIP会员随意看哦!
电子书推荐
-
大数据之路_阿里巴巴大数据实践 评分:
在阿里巴巴集团内,数据人员面临的现实情况是:集团数据存储已经达到EB级别,部分单张表每天的数据记录数高达几千亿条;在2016年“双11购物狂欢节”的24小时中,支付金额达到了1207亿元人民币,支付峰值高达12万笔/秒,下单峰值达17.5万笔/秒,媒体直播大屏处理的总数据量高达百亿级别且所有数据都需要做到实时、准确地对外披露……巨大的信息量给数据采集、存储和计算都带来了极大的挑战。
上传时间:2017-11 大小:106.61MB
- 10.34MB
阿里巴巴大数据实践之路.pdf
2022-02-25阿里巴巴大数据实践之路.pdf
- 7.73MB
阿里巴巴大数据实践之路-9.pdf
2022-06-26阿里巴巴大数据实践之路-9.pdf
- 104.86MB
阿里巴巴 大数据之路
2019-04-29阿里巴巴,作为距离大数据最近的公司之一,近几年对大数据却鲜有高谈阔论。实际上,阿里巴巴一开始就自然生长在数据的黑洞中,并且被越来越多、越来越密集的数据风暴裹挟。从需求→设计→迭代→升华为理论,在无数次的迭代进化中,阿里巴巴对大数据的理解才逐渐成形,慢慢能够在将数据黑洞为我所用的抗争中扳回一局。《大数据之路:阿里巴巴大数据实践》就是在这个过程中,由阿里巴巴数据技术及产品部沉淀下来的大数据知识与实践,值得每一位与大数据相关的人阅读。
- 106B
干货 | 36个大数据文档PDF开放下载-附件资源
2021-03-05干货 | 36个大数据文档PDF开放下载-附件资源
- 85.89MB
阿里大数据之路:阿里巴巴大数据实践-339页.zip
2021-09-29《阿里大数据之路:阿里巴巴大数据实践》是一本深入探讨阿里巴巴集团在大数据领域实践经验的书籍,共计339页,全面展示了阿里巴巴在大数据领域的技术积累和创新应用。这本书籍旨在分享阿里巴巴如何利用大数据技术来...
- 11.10MB
阿里巴巴大数据实践之路-陈鹏宇.pdf
2021-07-02阿里巴巴集团作为全球知名的互联网公司,其大数据实践之路为业界提供了宝贵的参考。本文将以阿里巴巴集团的数据发展作为主线,梳理其在大数据领域的实践与探索,尤其关注其数据中台架构的发展和应用。 ### 阿里巴巴...
- 3.77MB
阿里巴巴大数据实践之路.ppt
2022-05-26阿里巴巴大数据实践之路.ppt阿里巴巴大数据实践之路.ppt阿里巴巴大数据实践之路.ppt阿里巴巴大数据实践之路.ppt
- 315KB
阿里巴巴大数据之路——数据技术篇.pdf
2022-12-24阿里巴巴大数据之路的数据技术篇主要探讨了企业大数据处理的架构及其核心组成部分,包括数据采集、计算、服务和应用四个层面。在整体架构中,数据采集层使用DataX等工具进行数据同步,数据计算层依赖MaxCompute这样...
- 16.69MB
阿里巴巴的大数据实战总结大数据实战.zip
2020-08-16阿里巴巴的大数据实战总结,maxcompute,hadoop等。深度剖析淘宝、高德、友盟+、1688、优酷、阿里妈妈、阿里影业大数据实战场景,2020不容错过的企业大数据实战手册
- 89.37MB
GreenPLum6-1.pdf
2019-12-17GreenPlum6官方文档中文翻译,如下为节选: 有关配置,管理和监控Greenplum数据库安装以及管理,监控和使用数 据库的信息。该指南还包含有关Greenplum数据库架构和概念(例如 并行处理)的信息。 Greenplum数据库概念 这一节给出了Greenplum数据库组件和特性的概述,例如高可用 性、并行数据装载特性以及管理工具。 管理一个Greenplum系统 这一节描述了一个Greenplum数据库系统管理员所执行的基本系统 管理任务。 管理Greenplum数据库访问 保护Greenplum数据库,包括通过网络配置、数据库用户身份验 证、加密来保护对数据库的访问。 定义数据库对象 这一节包括Greenplum数据库中的数据定义语言(DDL)以及如何 创建和管理数据库对象。 分布与倾斜 Greenplum数据库依赖于跨节点的均匀数据分布。 插入, 更新, 和删除数据 这一节提供了Greenplum数据库中有关操纵数据和并发访问的信 息。 查询数据 本主题提供在Greenplum数据库中使用SQL的信息。 使用外部数据 外部表和外表都可以访问存储在Greenplum数据库之外的数据源中 的数据,就好像数据存储在常规数据库表中一样。您可以从外部表 和外表读取和写入数据。 装载和卸载数据 这一节中的主题描述了Greenplum数据库中将数据装载进来和写出 去的方法,以及如何格式化数据文件。 性能管理 这一节的内容是Greenplum数据库的性能管理,其中包含了如何监 控,以及如何通过配置工作量来进行资源调用的优先级管理。
- 211.58MB
postgresql和greenplum学习资料
2019-07-30整理了postgresql和greenplum学习资料,了解pg数据库原理和分布式数据库
- 119.84MB
大数据大创新-阿里巴巴云上数据中台之道.zip
2021-08-20《大数据大创新-阿里巴巴云上数据中台之道》是一份深度探讨阿里巴巴在云计算环境中构建数据中台策略和技术的资料。该资料围绕“阿里数据中台”这一核心概念,结合大数据的创新应用,揭示了企业如何借助大数据技术...
- 119.84MB
【精品】大数据大创新-阿里巴巴云上数据中台之道.rar
2021-07-21《大数据大创新-阿里巴巴云上数据中台之道》是一份深度探讨阿里巴巴在大数据与创新领域实践的资料。本文将从标题、描述以及标签所涉及的关键概念出发,详细阐述相关知识点,帮助读者理解大数据、创新、互联网及人工...
- 7.12MB
阿里大数据之路——关键总结版.pdf
2021-11-22阿里大数据之路的总结主要涵盖了大数据开发的关键技术和架构,包括数据的采集、存储、处理和分析等方面。以下是对这些内容的详细解析: 1. 数据采集 数据采集是大数据流程的第一步,涉及对Web和APP产生的数据进行...
- 420KB
阿里大数据之路.xmind
2020-07-10该资源包含了《大数据之路-阿里巴巴大数据》这本书的整体思维导图,并且按照自己从业经验进行归纳整理,囊括了:数据采集,数据计算,数据模型,数据管理,数据生命周期的相关知识点
- 3.5MB
海量大数据平台运维智能化实践_阿里巴巴.zip
2021-10-25本实践分享主要围绕“海量大数据平台运维智能化”,探讨阿里巴巴如何应对数据规模的增长,提升运维效率,降低运营成本,并确保服务的稳定性和可靠性。以下是基于这个主题的详细知识点: 1. **大数据平台架构**:...
- 3.65MB
海量大数据平台运维智能化实践_阿里巴巴.pdf
2021-08-24总而言之,阿里巴巴的海量大数据平台运维智能化实践是通过先进的数据化运维理念和技术手段,构建高效、智能的运维体系,以应对大数据环境下的复杂挑战,确保系统的稳定运行和高效服务。这种实践不仅提升了运维效率,...
- 1.44MB
阿里巴巴大数据运维实践.pdf
2021-10-14阿里巴巴大数据运维实践 阿里巴巴大数据运维实践是一份关于大数据运维的解决方案,旨在解决复杂的数据处理问题,提高业务效率和运营效率。本实践方案涵盖了从数据采集、储存、处理到分析和可视化的整个数据处理流程...
- 9.59MB
阿里巴巴大数据实践之路-陈鹏宇(PDF格式).rar
2024-06-01标题:阿里巴巴大数据实践之路-陈鹏宇(PDF格式).rar在数字化浪潮中,《阿里巴巴大数据实践之路-陈鹏宇》是一份珍贵的资源。本资料深入剖析了阿里巴巴如何利用大数据技术推动商业创新和效率提升。作者陈鹏宇凭借其...
- 20.90MB
2017杭州云栖大会_阿里大数据专场_大咖讲义全分享
2017-11-08阿里大数据专场 EB级别体量之下的高效数据赋能 阿里巴巴大数据智能技术 阿里巴巴人工智能驱动大数据 阿里巴巴数据资产管理 挑战双11实时数据洪峰的流计算实践 数据驱动智能助力企业成长 阿里巴巴全域数据建设
- 685.0MB
hadoop-3.3.4.tar.gz + winutils 安装环境
2023-08-03【开发环境】安装 Hadoop 运行环境 ( 下载 Hadoop | 解压 Hadoop | 设置 Hadoop 环境变量 | 配置 Hadoop 环境脚本 | 安装 winutils ) https://hanshuliang.blog.csdn.net/article/details/132045605 一、下载 Hadoop 二、解压 Hadoop 三、设置 Hadoop 环境变量 四、配置 Hadoop 环境脚本 五、安装 winutils 六、重启电脑 七、验证 Hadoop 安装效果
- 191.6MB
项目源码:基于Hadoop+Spark招聘推荐可视化系统 大数据项目 计算机毕业设计
2023-10-30项目源码:基于Hadoop+Spark招聘推荐可视化系统 大数据项目 计算机毕业设计 基于Hadoop+Spark的招聘推荐可视化系统是一种利用Hadoop和Spark等大数据处理技术,实现招聘推荐和可视化展示的应用系统。以下是该系统的主要介绍: 数据采集:系统通过各种渠道(如招聘网站、社交媒体等)获取大量的招聘相关数据,包括职位信息、公司信息、求职者信息等。这些数据以结构化或半结构化形式存在。 数据存储与处理:系统利用Hadoop分布式文件系统(HDFS)存储采集到的招聘数据,并使用Hadoop生态圈中的工具(如Hive、HBase等)进行数据处理和管理。Spark作为数据处理引擎,提供高性能的批处理和实时计算能力,对招聘数据进行清洗、转换和特征提取等操作。 招聘推荐:系统利用Spark的机器学习库(如MLlib)构建候选模型,通过对求职者的个人资料、工作经历、技能等特征进行分析,匹配合适的职位和公司。系统可以根据用户的偏好和需求,向其推荐最相关的招聘信息。 可视化展示:系统利用可视化工具(如matplotlib、Plotly等)将招聘数据以各种图表、图形等形式可视化展示。
- 1.49MB
基于Hadoop的电影影评数据分析
2023-04-04是大数据课程大作业,基于Hadoop的电影影评数据分析,需要安装Hadoop,了解MapReduce 和HDFS。
- 1.65MB
基于大数据的音乐推荐系统(适合本科毕设)
2023-02-02主要是用于大家对于大数据的基本处理,适合大学生本科毕设的参考。
- 191.6MB
基于Hadoop+Spark招聘推荐可视化系统 大数据项目 毕业设计(源码下载)
2023-10-21基于Hadoop+Spark招聘推荐可视化系统 大数据项目 毕业设计(源码下载) 基于Hadoop+Spark的招聘推荐可视化系统是一种利用Hadoop和Spark等大数据处理技术,实现招聘推荐和可视化展示的应用系统。以下是该系统的主要介绍: 数据采集:系统通过各种渠道(如招聘网站、社交媒体等)获取大量的招聘相关数据,包括职位信息、公司信息、求职者信息等。这些数据以结构化或半结构化形式存在。 数据存储与处理:系统利用Hadoop分布式文件系统(HDFS)存储采集到的招聘数据,并使用Hadoop生态圈中的工具(如Hive、HBase等)进行数据处理和管理。Spark作为数据处理引擎,提供高性能的批处理和实时计算能力,对招聘数据进行清洗、转换和特征提取等操作。 招聘推荐:系统利用Spark的机器学习库(如MLlib)构建候选模型,通过对求职者的个人资料、工作经历、技能等特征进行分析,匹配合适的职位和公司。系统可以根据用户的偏好和需求,向其推荐最相关的招聘信息。 可视化展示:系统利用可视化工具(如matplotlib、Plotly等)将招聘数据以各种图表、图形等形式可视化展示。例如,
- 21.24MB
适用于hadoop 3.3.5 3.3.6版本的winutils
2023-10-08winutils文件合集,Hadoop3.3.5以及3.3.6可用 winutils.exe是在windows系统上安装hadoop时所需要的winutils文件,内附多个版本,支持 hadoop-3.3.5 hadoop-3.3.6