分布式数据库和Hadoop都不够好,于是我们设计了分布式SQL计算系统


-
为了解决分布式数据库下,复杂的SQL(如全局性的排序、分组、join、子查询,特别是非均衡字段的这些逻辑操作)难以实现的问题;在有了一些分布式数据库和 Hadoop实际应用经验的基础上,对比两者的优点和不足,加上自己的一些提炼和思考,设计了一套综合两者的系统,利用两者的优点, 补充两者的不足。具体的说,使用数据库水平分割的思想实现数据存储,使用MapReduce的思想实现

-
2021-01-27
49.16MB
Hadoop实战中文版
2015-05-19《Hadoop实战》作为云计算所青睐的分布式架构,Hadoop是一个用Java语言实现的软件框架,在由大量计算机组成的集群中运行海量数据的分布式计算,是谷歌实现云计算的重要基石。《Hadoop实战》分
164.31MB
Hadoop与Spark 肖睿+PDF
2019-08-18大数据技术让我们以一种靠前的方式,对海量数据进行分析,从中获得有巨大价值的产品和服务,很终形成变革之力。本书围绕Hadoop和Spark两个主流大数据技术进行讲解,主要内容包括Hadoop环境配置、H
73KB
hadoop学习
2019-02-25什么是hadoop: (1)Hadoop是一个开源的框架,可编写和运行分布式应用处理大规模数据,是专为离线和大规模数据分析而设计的,并不适合那种对几个记录随机读写的在线事务处理模式。Hadoop=HD
49.16MB
Hadoop实战中文版.pdf
2015-01-19本书是一本系统且极具实践指导意义的hadoop工具书和参考书。内容全面,对hadoop整个技术体系进行了全面的讲解,不仅包括hdfs和mapreduce这两大核心内容,而且还包括hive、hbase、
10.49MB
开源的分布式内存文件系统 Tachyon.zip
2019-07-19Tachyon是一个分布式内存文件系统,可以在集群里以访问内存的速度来访问存在tachyon里的文件。把Tachyon是架构在最底层的分布式文件存储和上层的各种计算框架之间的一种中间件。主要职责是将那
14.97MB
hadoop构建数据仓库
2019-03-25本书讲述在流行的大数据分布式存储和计算平台 Hadoop 上设计实现数据仓库,将传统数据仓库建模与 SQL 开发的简单性与 大数据技术相结合,快速、高效地建立可扩展的数据仓库及其应用系统。
49.16MB
Hadoop实战(陆嘉恒)译
2013-03-20经过学术界和业界近10年的努力,Hadoop技术已经趋于完善而且应用广泛,几乎已经成为Big Data领域的事实标准。Hadoop技术本身比较复杂,而且还涉及Pig、ZooKeeper、Hive、HB
297KB
Hadoop技术在商业智能BI中的应用
2017-03-06Hadoop是个很流行的分布式计算解决方案,是Apache的一个开源项目名称,核心部分包括HDFS及MapReduce。其中,HDFS是分布式文件系统,MapReduce是分布式计算引擎。时至今日,H
37.65MB
大数据资料集锦
2016-03-30Hadoop集群监控与Hive高可用,Hadoop现场演示与编程过程,hadoop中文版API,HAWQ, 分布式SQL数据库引擎原生基于Hadoop HDFS,QCon-曹龙-Hadoop2.0应用
533KB
适合初学者-大数据技术与应用介绍(含各种组件).docx
2020-08-26NoSQL数据库种类介绍、大数据关键技术、大数据计算模式、大数据处理架构 分布式文件系统HDFS、分布式数据库HBASE、NoSQL、大数据处理与分析。 Hadoop分布式文件系统,具有处理超大数据、
21.67MB
分布式大数据查询引擎 PrestoDB.zip
2019-07-19Presto是Facebook最新研发的数据查询引擎,可对250PB以上的数据进行快速地交互式分析。据称该引擎的性能是 Hive 的 10 倍以上。 PrestoDB 是 Facebook 推出的一个
92.39MB
大型分布式网站架构与实践
2018-08-24第1章 面向服务的体系架构(SOA) 1 本章主要介绍和解决以下问题,这些也是全书的基础: HTTP协议的工作方式与HTTP网络协议栈的结构。 如何实现基于HTTP协议和TCP协议的RPC
2.58MB
SQL-DFS:一种基于HDFS的海量小文件存储系统.pdf
2017-09-13针对 Hadoop 分布式文件系统(Hadoop distributed file system,HDFS)进行小文件存储时 NameNode 内存占用率高的问题,通过分析 HDFS 基础架构,提出了
2.58MB
SQL-DFS:一种基于HDFS 的海量小文件存储系统
2018-04-23针对Hadoop 分布式文件系统(Hadoop distributed file system,HDFS)进行小文件存储时NameNode 内存占用率高的问题,通过分析HDFS 基础架构,提出了基于元
121KB
HadoopHive基础sql语法
2021-02-01Hive 是基于Hadoop构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop分布式文件系统中的数据,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能
130KB
Apache Hadoop---Hive.docx
2020-06-12Hive是Hadoop中的一个重要子项目,最早由Facebook设计,是建立在Hadoop基础上的数据仓库架构,它为数据仓库的管理提供了许多功能,包括:数据ETL(抽取、转换和加载)工具、数据存储管理
206KB
Hadoop集群安装维护文档
2021-02-03本文档是Hadoop集群的运维文档,提供了Hadoop集群安装方法和部署,以及对集群的监控。Hadoop是开源的、分布式的数据存储和计算基础框架,其核心包含HDFS和MapReduce等。HBase是
23.28MB
2013中国数据库大会ppt(1)
2013-05-31为方便大家阅读,已将ppt转换为pdf格式 下附目录: 大数据革命.pdf MPP NewSQL 数据库集群支撑企业超大规模数据仓库案例介绍.pdf Big Data in Action – 企业如何
1.8MB
Apache Hadoop---Sqoop.docx
2020-06-12Sqoop是SQL-to-Hadoop的缩写,是Hadoop的周边工具,它的主要作用是在结构化数据存储与Hadoop之间进行数据交换。Sqoop可以将一个关系型数据库(例如MySQL、Oracle、P
94KB
Spark产生的背景
2021-01-07大数据时代: 数据量大 数据种类繁多 数据增长速度快 大数据不同层面及技术: 大数据关键技术: 分布式存储 GFS/HDFS BigTable/HBase NoSQL(键值、列族、图形、文档数据库)
66.41MB
greenplum-db-6.10.0-rhel6-x86_64.rpm
2020-08-26greenplum-db-6.10 安装包linux6,开源版 如果想在数据仓库中快速查询结果,可以使用greenplum。 Greenplum数据库也简称GPDB。它拥有丰富的特性: 第一,完善的标
26.30MB
Hive编程指南 中文高清版(Programming Hive)
2014-07-21《hive编程指南》是一本apache hive的编程指南,旨在介绍如何使用hive的sql方法——hiveql来汇总、查询和分析存储在hadoop分布式文件系统上的大数据集合。全书通过大量的实例,首
59KB
Hadoop面试题(一)
2021-01-071、集群的最主要瓶颈 磁盘IO 2、Hadoop运行模式 单机版、伪分布式模式、完全分布式模式 3、Hadoop生态圈的组件并做简要描述 1)Zookeeper:是一个开源的分布式应用程序
39B
视频教程 资源全面 基于大数据技术之电视收视率企业项目实战(hadoop+Spark)
2018-06-28课程介绍 本课程将通过一个电视收视率项目实战驱动讲解,项目案例是国内的一家广电企业作为非洲国家的一个运营商,以用户收视行为数据作为基础数据,通过对频道和节目的分析,采用多维度统计分析的方法挖掘用户的收
3.90MB
cdh6.1.0搭建手册.pdf
2020-04-01CDH是Cloudera公司推出的基于稳定版本的Apache Hadoop构建,是Hadoop众多分支中的一种。 CDH提供了Hadoop的核心元素 - 可扩展的存储和分布式计算 - 以及基于Web的
22.16MB
presto-hive-hadoop1-0.65.zip
2019-10-18presto.zip,presto-hive connector-apache hadoop 1.xtpresto分布式大数据sql查询引擎的官方主页
164.91MB
jdk-8u281-windows-x64.exe
2021-02-07jdk-8u281-windows-x64.exe
C++入门基础视频精讲
2018-09-28本课程讲述了c++的基本语言,进阶语言,以实战为基准,高效率传递干货, 教会学员命令行编译直击底层过程,现场编码 并且掌握各种排错思路
Java学习指南(Java入门与进阶)
2017-08-09这是Java学习指南系列课程的第1篇,介绍Java语言的入门语法,引领希望学习Java语言编程的初学者进入Java大门。 本课程不需要其他语言作为基础,可以直接学习。 课程从Java开发平台的下载和安装开始,从浅到深、从易到难,循序渐进地进行语法讲解。 为了让学员更好的掌握Java语言,本课程配套在线的Java题库及答案解析。 相比于其他语言,Java语言更科学、更容易掌握,快来和大家一起学习Java吧。
征服C++ 11视频精讲
2016-09-02【为什么还需要学习C++?】 你是否接触很多语言,但从来没有了解过编程语言的本质? 你是否想成为一名资深开发人员,想开发别人做不了的高性能程序? 你是否经常想要窥探大型企业级开发工程的思路,但苦于没有基础只能望洋兴叹? 那么C++就是你个人能力提升,职业之路进阶的不二之选。 【课程特色】 1.课程共19大章节,239课时内容,涵盖数据结构、函数、类、指针、标准库全部知识体系。 2.带你从知识与思想的层面从0构建C++知识框架,分析大型项目实践思路,为你打下坚实的基础。 3.李宁老师结合4大国外顶级C++著作的精华为大家推出的《征服C++11》课程。 【学完后我将达到什么水平?】 1.对C++的各个知识能够熟练配置、开发、部署; 2.吊打一切关于C++的笔试面试题; 3.面向物联网的“嵌入式”和面向大型化的“分布式”开发,掌握职业钥匙,把握行业先机。 【面向人群】 1.希望一站式快速入门的C++初学者; 2.希望快速学习 C++、掌握编程要义、修炼内功的开发者; 3.有志于挑战更高级的开发项目,成为资深开发的工程师。 【课程设计】 本课程包含3大模块 基础篇 本篇主要讲解c++的基础概念,包含数据类型、运算符等基本语法,数组、指针、字符串等基本词法,循环、函数、类等基本句法等。 进阶篇 本篇主要讲解编程中常用的一些技能,包含类的高级技术、类的继承、编译链接和命名空间等。 提升篇: 本篇可以帮助学员更加高效的进行c++开发,其中包含类型转换、文件操作、异常处理、代码重用等内容。
-
下载
正交跳频信号动态分类的一种方法
正交跳频信号动态分类的一种方法
-
下载
logger-message-generator:LoggerMessage生成器工具。 使用项目中的LogEvents.json生成ILogger扩展-源码
logger-message-generator:LoggerMessage生成器工具。 使用项目中的LogEvents.json生成ILogger扩展-源码
-
学院
实现 MySQL 读写分离的利器 mysql-proxy
实现 MySQL 读写分离的利器 mysql-proxy
-
博客
SpringCloud 第二章:SpringCloud简介与功能介绍
SpringCloud 第二章:SpringCloud简介与功能介绍
-
博客
【HCIA-Big Data】第三章测一测答案
【HCIA-Big Data】第三章测一测答案
-
下载
春天引导form2-源码
春天引导form2-源码
-
博客
arthas下载
arthas下载
-
学院
MySQL 性能优化(思路拓展及实操)
MySQL 性能优化(思路拓展及实操)
-
博客
【优化求解】PSO货物配装问题最优化【Matlab 296期】
【优化求解】PSO货物配装问题最优化【Matlab 296期】
-
博客
Leetcode每日随机2021/3/4
Leetcode每日随机2021/3/4
-
下载
模糊容差关系的最佳逼近
模糊容差关系的最佳逼近
-
学院
《文本处理 awk sed grep ”三剑客”》<Linux核心命令
《文本处理 awk sed grep ”三剑客”》<Linux核心命令
-
学院
2021年软考系统规划与管理师-上午历年真题解析视频课程
2021年软考系统规划与管理师-上午历年真题解析视频课程
-
学院
MySQL 主从复制 Replication 详解(Linux 和 W
MySQL 主从复制 Replication 详解(Linux 和 W
-
下载
随机过程参考答案2015.pdf
随机过程参考答案2015.pdf
-
学院
《文件和目录操作命令》<Linux核心命令系列Series> <2.>
《文件和目录操作命令》<Linux核心命令系列Series> <2.>
-
博客
BSN赋能浙江移动5G+区块链应用加速落地
BSN赋能浙江移动5G+区块链应用加速落地
-
博客
threejs获取已创建scene的子对象
threejs获取已创建scene的子对象
-
下载
12 总也倒不了的老屋 教案.docx
12 总也倒不了的老屋 教案.docx
-
学院
Galera 高可用 MySQL 集群(PXC v5.6 + Ngin
Galera 高可用 MySQL 集群(PXC v5.6 + Ngin
-
学院
Unity RUST 逆向安全开发
Unity RUST 逆向安全开发
-
下载
LTE频段36.101.jpg
LTE频段36.101.jpg
-
博客
网络上出现负面新闻该怎么处理?企业如何处理负面信息?
网络上出现负面新闻该怎么处理?企业如何处理负面信息?
-
学院
MHA 高可用 MySQL 架构与 Altas 读写分离
MHA 高可用 MySQL 架构与 Altas 读写分离
-
博客
3*0.1 == 0.3 返回 true还是 false
3*0.1 == 0.3 返回 true还是 false
-
学院
libFuzzer视频教程
libFuzzer视频教程
-
博客
String类中的面试常考点
String类中的面试常考点
-
学院
MySQL 多平台多模式(安装、配置和连接 详解)
MySQL 多平台多模式(安装、配置和连接 详解)
-
下载
软件测试实验报告(共5个).zip
软件测试实验报告(共5个).zip
-
学院
【拯救者 】数据库系统概论速成
【拯救者 】数据库系统概论速成