VIP会员
作者:CSDN
出版社:CSDN《程序员》
ISBN:1111111111117
VIP会员免费
(仅需0.8元/天)
¥ 40000.0
温馨提示: 价值40000元的1000本电子书,VIP会员随意看哦!
电子书推荐
-
Apache Kylin权威指南 评分:
Apache Kylin权威指南 全
上传时间:2017-07 大小:20.33MB
- 20.36MB
Apache Kylin 权威指南
2018-02-12清晰的文字,是快速入门OLAP,学习使用kylin的入门神器 ps:让我填所属分类,好bt,要么你就整个全一点的数据库,分类多点,找了半天没有找到OLAP,KYLIN;让我没得选,只能选择大数据->hive了,比较相近了
- 20.27MB
Apache_Kylin权威指南
2018-05-30大数据与传统技术最大的区别就在于数据的体量对查询带来的巨大挑战。从最早使用大数据技术来做批量处理,到现在越来越多地需要大数据平台也能够如传统数据仓库技术一样支持交互式分析。随着数据量的不断膨胀,数据平民化的不断推进,低延迟、高并发地在Hadoop之上提供标准SQL查询的能力成为必须要攻破的技术难题。而Apache Kylin的诞生正是基于这个背景,并成功地完成了很多人认为不可能实现的突破。Apache Kylin最初诞生于eBay中国研发中心(坐落于上海浦东新区的德国中心),在2013年9月底,eBay中国研发中心的技术人员开始对此进行POC并组建团队,经过一年的艰苦开发和测试,于2014年9月30日使其正式上线,并在第二天(2014年10月1日)正式开源。
- 20.97MB
Apache-Kylin-权威指南
2018-03-23kylin 核心团队书籍 kylin 核心团队书籍 kylin 核心团队书籍 kylin 核心团队书籍
- 20.28MB
Apache+Kylin权威指南
2018-11-24Apache Kylin是Hadoop大数据平台上的一个开源OLAP引擎。它采用 多维立方体预计算技术,可以将大数据的SQL查询速度提升到亚秒级别。 相对于之前的分钟乃至小时级别的查询速度,亚秒级别速度是百倍到千 倍的提升,该引擎为超大规模数据集上的交互式大数据分析打开了大 门。 Apache Kylin也是中国人主导的、唯一的Apache顶级开源项目,在开 源社区有世界级的影响力。
- 14.86MB
Apache_Kylin权威指南1
2018-01-03完整版,带有书签,Apache_Kylin权威指南,466页,不要12分,只要5分!!1
- 15.90MB
Apache+Kylin权威指南.pdf
2019-04-07Apache Kylin中文版权威指南,Apache Kylin是Hadoop大数据平台上的一个开源OLAP引擎。 另外,如果大家积分不足的话呢,也可以私信数字“0007”至我的微信公众号,来获取该资源。更重要的是公众号里面也有Apache Kylin相关文章噢,减少你的学习成本。 Kylin采用多维立方体预计算技术,可以将大数据的SQL查询速度提升到亚秒级别。相对于之前的分钟乃至小时级别的查询速度,亚秒级别速度是百倍到千倍的提升,该引擎为超大规模数据集上的交互式大数据分析打开了大门。 Apache Kylin也是中国人主导的、唯一的Apache顶级开源项目,在开源社区有世界级的影响力。 对于数据分析来说,挺有必要看的一本书,推荐给大家。 快快下载学习吧~
- 20.33MB
Apache_Kylin权威指南.PDF
2017-08-14Apache Kylin是基于Hadoop大数据平台的开源OLAP引擎,为超大规模数据集提供快速交互式分析能力,在万亿规模数据上提供亚秒级的查询性能。本书由Apache Kylin核心团队(PMC member)编写,系统地介绍了Apache Kylin的 背景、原理、基础知识、调优、运维、二次开发等 各个方面,是关于Apache Kylin的权威指南
- 3.73MB
mysql-connector-java-5.1.40.tar.gz
2020-12-02mysql-connector-java-5.1.40.tar.gz上传到Linux系统中,然后在Linux系统中新打开一个终端,在终端中执行命令解压缩文件:
- 2.14MB
Apache atlas使用说明文档.pdf(转载分享请注明出处)
2019-10-17元数据管理apache atlas 自己总结的使用说明文档。主要包括Apache atlas 第一章: Apache atlas简介 1.1 apache atlas 架构介绍 2 1.1.1核心组件Core 2 1.1.2 Integration 4 1.1.3 Metadata source 4 1.1.4 应用领域 4 .2 apache atlas基本功能 4 第二章: Atlas Admin UI 使用介绍 5 2.1 Search 5 2.1.1 BASE SEARCH 5 2.1.2 Advanced search 6 2.1.3创建实体 7 2.1.4 Lineage 7 2.2 Classification 8 2.2.1 为实体添加分类 8 2.3 Glossary 8 2.3.1术语视图 10 2.3.2分类视图 12 2.3.3术语分配流程 15 2.3.4 使用术语搜索 16 第三章:Atalas API 使用介绍 16 3.1 Admin rest API 16 3.2 DiscoveryREST 17 3.3 TypesREST 17 3.4 EntityREST 18 3.5 LineageREST 18 第四章:源码编译与安装 18 4.1 源码下载与编译 18 4.2 源码编译与安装注意事项 19 4.3 Apache atlas 安装 19 第五章:hook引入(hive举例) 20 5.1配置文件修改 20 5.2 配置文件其他相关操作 21 第六章:Atlas 整合spark 22
- 4.14MB
超市销售数据分析.csv
2022-07-30数据挖掘、数据统计、数据库应用甚至练习表格操作均可,CSV格式绿色环保,可转文本可转表格,易于操作,4.2w条数据,来源于生活,更便于统计,更容易发现数据规律(我自己只找过两三个指标)。 数据字段:顾客编号 大类编码 大类名称 中类编码 中类名称 小类编码 小类名称 销售日期 销售月份 商品编码 规格型号 商品类型 单位 销售数量 销售金额 商品单价 是否促销。 数据样例: 0 12 蔬果 1201 蔬菜 120109 其它蔬菜 20150101 201501 DW-1201090311 生鲜 个 8 4 2 否 实际数据四万余条,是整齐的,好看好用,Excel打开也能直接用。
- 1.44MB
大数据实验六实验报告:熟悉Hive的基本操作
2022-06-20“大数据技术原理与应用”课程实验报告 题目:实验六:熟悉Hive的基本操作 姓名:小猪猪 日期:2022/5/15 1、实验环境: 设备名称 LAPTOP-9KJS8HO6 处理器 Intel(R) Core(TM) i5-10300H CPU @ 2.50GHz 2.50 GHz 机带 RAM 16.0 GB (15.8 GB 可用) 主机操作系统 Windows 10 家庭中文版 虚拟机操作系统 ubuntukylin-16.04 Hadoop 版本 3.1.3 JDK 版本 1.8 Java IDE:Eclipse 系统类型 64 位操作系统, 基于 x64 的处理器 笔和触控 没有可用于此显示器的笔或触控输入 2、实验内容与完成情况: 1.创建一个内部表 stocks,字段分隔符为英文逗号,表结构如下所示: stocks 表结构:
- 239.13MB
淘宝用户购物行为数据分析项目数据集
2023-03-23淘宝用户购物行为数据分析项目数据集
- 17KB
1、ETL工程师经典面试题.md
2022-02-151. 什么是数据准备区?在数据准备区中允许使用的数据结构有哪些?各有什么优缺点? 2. 简述异构数据源中的数据抽取技术。 3. 数据质量检查的四大类是什么?为每类提供一种实现技术。 4. 简述数据仓库中的表的基本类型,以及为了保证引用完整性该以什么样的顺序对它们进行加载。 5. 在 ETL过程中四个基本的过程分别是什么? 6. 从 ERP源系统中抽取数据最好的方法是什么? 7. 简述直接连接数据库和使用 ,ODBC连接数据库进行通讯的优缺点。 8. 什么是代理键?简述代理键替换管道如何工作。 9. 什么叫缓慢维度变化?请分别阐述三大类维度处理方式。 10. 如何实现增量抽取,分别阐述各种增量抽取方式,并且比较各种方式的优劣,及你推荐的做法? 11. 用过什么 ETL工具,以及该工具简单讲述特点。 12. ETL 工具一般有哪些组成部分,其中数据流中常用的控件有? 13. 简述你在以前项目中的 ETL架构思想。
- 109KB
离线数据处理 任务一:数据抽取
2024-01-15离线数据处理 任务一:数据抽取
- 1.16MB
尚硅谷大数据技术之数据湖Iceberg-1.1.0.docx
2024-03-06尚硅谷大数据技术之数据湖Iceberg-1.1.0
- 17.66MB
hive-jdbc-uber-2.6.5.0-292.jar
2019-06-01这个jar包可以用于使用DateGrip连接Hive时添加jdbc驱动时使用。 详细的可以参考我的一篇教程《使用DataGrip连接Hive》
- 4.74MB
Hive进阶Day06
2024-04-15Hive进阶Day06
- 24.0MB
Hive数据仓库之垃圾分类数据分析系统
2023-08-14主要功能和技术说明如下: (1)Flume数据采集,HDFS数据储存 (2)hive数据仓库分层设计,包含ODS、DWD、ADS层 (3)sqoop数据迁移,完成HIve与MySQL数据库中的数据交互 (4)Echarts搭建动态可视化大屏 (5)SpringBoot搭建可视化后台系统,完成前端与后台的数据传递与交互。 (6)基于Cenots7 搭建虚拟机,配置Hadoop、HDFS、Hive、sqoop、flume、mysql等大数据组件。
- 204B
Kettle 9.1和8.2版本
2020-11-239.1版本 Kettle,很好的开源ETL工具,免安装,直接解压使用,百度网盘链接,官网巨慢,搬运不易!
- 21.4MB
基于大数据技术的用户日志数据分析及可视化平台搭建项目代码及数据集
2023-03-23基于大数据技术的用户日志数据分析及可视化平台搭建项目代码及数据集
- 23.79MB
电商销售数据复盘用教程数据 hive分析-菜鸟入门
2021-12-08配合实战使用~
- 56.86MB
hive-2.3.3jdbc驱动程序
2022-10-27用于DataGrip连接虚拟机的hive数据库
- 61.25MB
datagrip连接hive-jdbc-3.1.2-standalone
2023-11-13datagrip连接hive-jdbc-3.1.2-standalone
- 1.80MB
大数据真实数仓项目完整版.zip
2019-06-21最新大数据真实数仓项目完整版,有设计文档,数据建模以及相关脚本,绝对真实,线上项目
- 65.44MB
Hive数据仓库之电商用户数据分析系统
2023-08-10主要功能和技术说明如下: (1)Flume数据采集,HDFS数据储存 (2)hive数据仓库分层设计,包含ODS、DWD、ADS层 (3)sqoop数据迁移,完成HIve与MySQL数据库中的数据交互 (4)Echarts搭建动态可视化大屏 (5)SpringBoot搭建可视化后台系统,完成前端与后台的数据传递与交互。 (6)基于Cenots7 搭建虚拟机,配置Hadoop、HDFS、Hive、sqoop、flume、mysql等大数据组件。 (7)代码简单易懂,包含一定的注释。 (8)数据来源为淘宝平台发布的公开数据,数据字段包括用户id、年龄、性别、商品id、商品类型id、用户行为、省份等。
- 182KB
数据仓库规范设计.pdf
2019-11-04数据仓库规范设计.pdf
- 631KB
HiveSQL基础Day02
2024-04-10HiveSQL基础Day02
- 22.5MB
大屏大数据可视化psd原图
2020-01-09大屏大数据可视化,photoshop的psd图原图,此图有层图,很方便用于转换成工程师应用的各类图。前端ui设计和美工设计可用
- 102.81MB
普元元数据管理系统v6.0管理员手册.pdf
2020-09-15可以参看,好资料大家共享。可以参看,好资料大家共享。