VIP会员
作者:CSDN
出版社:CSDN《程序员》
ISBN:1111111111117
VIP会员免费
(仅需0.8元/天)
¥ 40000.0
温馨提示: 价值40000元的1000本电子书,VIP会员随意看哦!
电子书推荐
-
开源大数据分析引擎Impala实战 评分:
《开源大数据分析引擎Impala实战》内容Impala是Cloudera公司ZHI名品牌开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。Impala1.0版比原来基于MapReduce的HiveSQL查询速度提升3~90倍,因此,Impala有可能接近取代Hive。作者基于自己在本职工作中应用Impala的实践和心得编写了《开源大数据分析引擎Impala实战》。《开源大数据分析引擎Impala实战》共分10章,全面介绍开源大数据分析引擎Impala的技术背景、安装与配置、架构、操作方法、性能优化,以及很富技术含量的应用设计原则和应用案例。
上传时间:2018-01 大小:98.37MB
- 4.18MB
大规模数据查询Hive及Impala技术原理及架构.pdf
2015-09-24大规模数据查询Hive及Impala技术原理及架构
- 98.67MB
Impala实战
2018-08-17开源大数据分析引擎Impala实战_贾传青著_北京:清华大学出版社_2015.03_P329_完整版 PDF电子书下载 带书签目录
- 727B
Impala大数据分析引擎课程
2022-06-08课程分享——Impala大数据分析引擎,完整版视频课程下载。 课程介绍 Impala由Cloudera公司主导开发的大数据实时查询分析工具,宣称比原来基于MapReduce的HiveSQL查询速度提升3~90倍,且更加灵活易用。提供类SQL的...
- 50.67MB
基于 Impala 构建实时用户行为分析引擎.pdf
2018-12-26包含基于 Impala 构建实时用户行为分析引擎.pdf和.开源大数据分析引擎Impala实战.pdf两份
- 235KB
大数据分析查询引擎Impala.docx
2022-07-13大数据分析查询引擎Impala.docx
- 1.12MB
第14章 基于Hadoop的数据仓库Hive
2016-04-26本章首先介绍了数据仓库的概念、Hive的...同时,介绍了新一代开源大数据分析引擎Impala及其与Hive的比较分析;最后,以单词统计为例,介绍了如何使用Hive进行简单编程,并说明了Hive编程相对于MapReduce编程的优势。
- 1KB
Impala大数据分析快速入门视频教程
2021-10-21手把手视频详细讲解项目开发全过程,需要的小伙伴...基于分析案例实现Impala数据管理 5.Impala与应用系统集成JDBC 第五章:Impala原理深入 1.Impala各角色功能详解 2.Impala任务提交原理 3.Impala元数据同步原理
- 8.42MB
10-1+Impala+落地&优化:神策数据多维分析平台构建实战.pdf
2022-03-1810-1+Impala+落地&优化:神策数据多维分析平台构建实战
- 4.16MB
利用Impala+Kudu构建准实时分析应用
2017-05-16Kudu是Cloudera开源的新型列式存储系统,Apache Hadoop生态圈的顶级项目之一,解决了传统Lamda架构处理Hadoop上快速变化数据的存储和处理技术过于复杂的问题,同时Kudu能够与Hadoop生态的其他组件比如Impala、Spark...
- 3.33MB
基于 Impala 构建实时用户行为分析引擎
2017-08-25基于 Impala 构建实时用户行为分析引擎
- 1.37MB
论文研究-基于Impala的大数据查询分析计算性能研究.pdf
2019-07-22分析了Cloudera公司推出的Impala实时查询引擎原理与架构,并深入比较Impala与传统MapReduce的性能与特点,针对Impala进行复杂大数据处理方面的不足,提出了MapReduce与Impala结合的大数据处理方法,通过使用 ...
- 12.78MB
springboot集成impala(包含yml、impala配置类、pom.xml、impala jar)
2020-09-18springboot集成impala,包含yml文件、impala配置Bean、ImpalaJDBC41-2.6.4.1005.jar和impala在pom.xml中的配置,有问题留言
- 197KB
impala分析
2014-08-05impala源代码分析1,impala是比hadoop更加快的一种分布式集群处理文件系统
- 416KB
BIEE配置ODBC连接impala
2018-06-14BIEE配置ODBC连接impala BIEE配置ODBC连接impala BIEE配置ODBC连接impala
- 501KB
漫谈大数据查询引擎之Impala的架构设计
2021-01-27最近在使用impala,顺便学习一下相关的原理部分。下面的组织结构会先介绍一下impala的大致原理和涉及的技术,然后对每块涉及到的技术做一个梳理,最后再深入一点impala的原理。从系统架构来看,商用服务器大体可以...
- 209KB
大数据分析平台.docx
2022-12-23而Impala思想来源于Google Dremel,充分利用分布式的集群和高效存储方式来加快大数据集上的查询速度,这也就是我上面说到的近似实时查询;底层的文件系统当然是HDFS独大,也就是Hadoop的底层存储,现在大数据的技术...
- 147.51MB
impala-2.1
2019-01-21hadoop大数据集群组建,实时数据分析工具impala,需要基于大数据集群部署
- 306KB
Impala自动刷新元数据配置.docx
2021-09-07Impala自动刷新元数据配置.docx
- 30.10MB
1-4-Hive+and+Impala.pdf
2019-05-09Hive适合于长时间的批处理查询分析,而Impala适合于实时交互式SQL查询,Impala给数据分析人员提供了快速实验、验证想法的大数 据分析工具。可以先使用hive进行数据转换处理,之后使用Impala在Hive处理后的结果数据集...
- 191.6MB
项目源码:基于Hadoop+Spark招聘推荐可视化系统 大数据项目 计算机毕业设计
2023-10-30项目源码:基于Hadoop+Spark招聘推荐可视化系统 大数据项目 计算机毕业设计 基于Hadoop+Spark的招聘推荐可视化系统是一种利用Hadoop和Spark等大数据处理技术,实现招聘推荐和可视化展示的应用系统。以下是该系统的主要介绍: 数据采集:系统通过各种渠道(如招聘网站、社交媒体等)获取大量的招聘相关数据,包括职位信息、公司信息、求职者信息等。这些数据以结构化或半结构化形式存在。 数据存储与处理:系统利用Hadoop分布式文件系统(HDFS)存储采集到的招聘数据,并使用Hadoop生态圈中的工具(如Hive、HBase等)进行数据处理和管理。Spark作为数据处理引擎,提供高性能的批处理和实时计算能力,对招聘数据进行清洗、转换和特征提取等操作。 招聘推荐:系统利用Spark的机器学习库(如MLlib)构建候选模型,通过对求职者的个人资料、工作经历、技能等特征进行分析,匹配合适的职位和公司。系统可以根据用户的偏好和需求,向其推荐最相关的招聘信息。 可视化展示:系统利用可视化工具(如matplotlib、Plotly等)将招聘数据以各种图表、图形等形式可视化展示。
- 685.0MB
hadoop-3.3.4.tar.gz + winutils 安装环境
2023-08-03【开发环境】安装 Hadoop 运行环境 ( 下载 Hadoop | 解压 Hadoop | 设置 Hadoop 环境变量 | 配置 Hadoop 环境脚本 | 安装 winutils ) https://hanshuliang.blog.csdn.net/article/details/132045605 一、下载 Hadoop 二、解压 Hadoop 三、设置 Hadoop 环境变量 四、配置 Hadoop 环境脚本 五、安装 winutils 六、重启电脑 七、验证 Hadoop 安装效果
- 1.65MB
基于大数据的音乐推荐系统(适合本科毕设)
2023-02-02主要是用于大家对于大数据的基本处理,适合大学生本科毕设的参考。
- 1.49MB
基于Hadoop的电影影评数据分析
2023-04-04是大数据课程大作业,基于Hadoop的电影影评数据分析,需要安装Hadoop,了解MapReduce 和HDFS。
- 191.6MB
基于Hadoop+Spark招聘推荐可视化系统 大数据项目 毕业设计(源码下载)
2023-10-21基于Hadoop+Spark招聘推荐可视化系统 大数据项目 毕业设计(源码下载) 基于Hadoop+Spark的招聘推荐可视化系统是一种利用Hadoop和Spark等大数据处理技术,实现招聘推荐和可视化展示的应用系统。以下是该系统的主要介绍: 数据采集:系统通过各种渠道(如招聘网站、社交媒体等)获取大量的招聘相关数据,包括职位信息、公司信息、求职者信息等。这些数据以结构化或半结构化形式存在。 数据存储与处理:系统利用Hadoop分布式文件系统(HDFS)存储采集到的招聘数据,并使用Hadoop生态圈中的工具(如Hive、HBase等)进行数据处理和管理。Spark作为数据处理引擎,提供高性能的批处理和实时计算能力,对招聘数据进行清洗、转换和特征提取等操作。 招聘推荐:系统利用Spark的机器学习库(如MLlib)构建候选模型,通过对求职者的个人资料、工作经历、技能等特征进行分析,匹配合适的职位和公司。系统可以根据用户的偏好和需求,向其推荐最相关的招聘信息。 可视化展示:系统利用可视化工具(如matplotlib、Plotly等)将招聘数据以各种图表、图形等形式可视化展示。例如,
- 21.24MB
适用于hadoop 3.3.5 3.3.6版本的winutils
2023-10-08winutils文件合集,Hadoop3.3.5以及3.3.6可用 winutils.exe是在windows系统上安装hadoop时所需要的winutils文件,内附多个版本,支持 hadoop-3.3.5 hadoop-3.3.6
- 1.26MB
数据科学导论实验报告 实验1:常用Linux操作和 Hadoop操作
2023-04-30数据科学导论 实验1:常用Linux操作和 Hadoop操作 1、Linux虚拟机安装和操作 2、Hadoop安装和操作 1)创建Hadoop用户 2)SSH登录权限设置 3)安装Java环境 4)单机安装配置 5)伪分布式安装配置
- 177.69MB
淘宝用户行为数据集
2019-01-053182257条数据,可做推荐系统,数据分析 它包含字段(id, uid,age,gender,item_id, behavior_type, item_category, date, province) //1.浏览、2.收藏、3.加购物车 4.购买 7.统计各省的前十热门关注产品(浏览+收藏+添加购物车+购买总量最多前10的产品) 8.统计各省的前十热门购买产品(销售最多前10的产品) 9.统计各省销售最好的产品类别前10(销售最多前10的产品类别) 10.统计各省男女用户数量(gender 0:男 1:女 2:未知)
- 322.41MB
hadoop-3.1.3.tar.gz
2022-01-24[免费]hadoop-3.1.3官网的包 你们CSDN上的这些人是有多不要脸,这玩意还要积分,怎么滴,你们写出来的hadoop?
- 7.75MB
中文官方教程_tableau_prep.pdf
2021-04-13数据分析,数据挖掘,ETL处理工程师等。