- Hive大小:3MBHive优化以及执行原理,一位前辈总结的hive知识,个人觉得非常有用,资源难找,现在贡献给大家,独乐乐不如众乐乐。Hive优化以及执行原理,一位前辈总结的hive知识,个人觉得非常有用,资源难找,现在贡献给大家,独乐乐不如众乐乐。1 1070浏览会员免费
- -- 拉链表介绍 在数据分析中有时会需要维护一些历史状态,比如订单状态变化,评分变化,为了保存下来这些状态变化的路径,可以同过拉链表实现 -- 使用场景 1、数据量比计较大,但业务要求每次需要查询全量历史,每天存储一份全量数据太占用存储空间 2、记录变更不大,比如只有装填和更新时间有变动,其他字段都不变0 2900浏览会员免费
- Apache Kylin™是一个开源的分布式分析引擎,提供Hadoop/Spark之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay Inc. 开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。5 129浏览会员免费
- 入门到深入学习,适合初学者和想深入了解的人员查看。包含了安装及常用命令、优化等。4 107浏览会员免费
- Hive应用案例,Hive应用案例,Hive应用案例,Hive应用案例,Hive应用案例0 463浏览会员免费
- 数据仓库大小:641KB行政区域维度表、时间维度表、日期维度表,表结构、表数据、建表语句、生成数据的python脚本。行政区域维度表、时间维度表、日期维度表,表结构、表数据、建表语句、生成数据的python脚本。5 1104浏览¥ 5.90
- 本文利用搜狗搜索日志的500w条数据,对搜索日志进行了一系列的分析。主要分为两个阶段,第一阶段是数据准备、数据预处理和数据加载阶段,第二阶段为分析阶段。利用Hive等工具,完成30页的分析报告。5 1301浏览会员免费
- 本文档为总结的hive基础知识,包括hive服务、变量和属性、日志、表操作……等基础知识。0 651浏览会员免费
- sasl-0.2.1大小:3MBsasl-0.2.1-cp34-cp34m-win_amd64.whl python3.4.4 的依赖包,3.4版本的都可以用 直接使用pip install sasl-0.2.1-cp34-cp34m-win_amd64.whl 命令安装就行了sasl-0.2.1-cp34-cp34m-win_amd64.whl python3.4.4 的依赖包,3.4版本的都可以用 直接使用pip install sasl-0.2.1-cp34-cp34m-win_amd64.whl 命令安装就行了0 244浏览会员免费
- hive大小:83MB发现国内没有1.1.0的归档镜像了,在官方文档下载了好久。发现国内没有1.1.0的归档镜像了,在官方文档下载了好久。0 542浏览会员免费
- atlas大小:12MBatlas hive hook 已编译版本apache-atlas-2.1.0-hive-hook.tar.gz 可用于hive中进行数据抓取 和元数据信息管理atlas hive hook 已编译版本apache-atlas-2.1.0-hive-hook.tar.gz 可用于hive中进行数据抓取 和元数据信息管理0 666浏览会员免费
- 大数据大小:21MB基于大数据技术的用户日志数据分析及可视化平台搭建项目代码及数据集基于大数据技术的用户日志数据分析及可视化平台搭建项目代码及数据集5 674浏览会员免费
- hive大小:123MBhive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析0 611浏览会员免费
- hive大小:87MBhive-1.2.2源码包,官网下载。 hive-1.2.2源码包,官网下载。hive-1.2.2源码包,官网下载。 hive-1.2.2源码包,官网下载。0 220浏览会员免费
- 本文档主要总结了hive的参数优化,对hive的理解具有一定的作用0 1694浏览会员免费
- 建立数据仓库是一个解决企业问题的过程,业务人员往往不懂如何建立和使 用数据仓库,发挥其决策支持的作用;信息部门的人员往往又不懂业务,不 知道应该建立哪些决策主题,从数据源中抽取哪些数据。因此数据仓库的项 目小组应该由业务人员和信息部门的人员共同组成,双方需要相互沟通,协 作开发数据仓库2 217浏览会员免费
- 大数据大小:488MB使用apache-maven-3.6及各种组件编译好的包,atlas是apache旗下的元数据管理软件,可以和大部分大数据组件集成,从而管理所有数据信息的元数据,方便后续数据资产的管理,官网只存在源码文件包,此处将源码在linux系统下完成编译,方便各位使用。 可单机,可集群,本人都成功搭建过,因为搭建atlas踩过好多坑,所以知道其中不易。包含内嵌Hbase和solr, 和各种所需hook ,绝对良心资源。使用apache-maven-3.6及各种组件编译好的包,atlas是apache旗下的元数据管理软件,可以和大部分大数据组件集成,从而管理所有数据信息的元数据,方便后续数据资产的管理,官网只存在源码文件包,此处将源码在linux系统下完成编译,方便各位使用。 可单机,可集群,本人都成功搭建过,因为搭建atlas踩过好多坑,所以知道其中不易。包含内嵌Hbase和solr, 和各种所需hook ,绝对良心资源。0 599浏览会员免费
- Hive 简明教程 第一部分:完全以日常使用为目标,整理了常用的Hive 语法,而抛弃了不常用的部分,用来 满足不懂技术的分析人员来快速使用Hive 进行常见的日常数据分析。 第二部分:如果想能写出高效的Hive 语句,必须要先了解Hive 执行原理,然后掌握一系列 的优化方法。所以第二部分主要内容是Hive 原理与优化。 第三部分:讲解Hive 的一系列技术细节,以满足技术人员想了解技术细节的要求,为能更加 高效和灵活地使用Hive 提供技术基础0 393浏览会员免费
- hive大小:16MB亲自测试可以用,完整的jar包,网上很多jar下载都用不了,要不就是版本不匹配,然后自己一个个调试然后一个个找过来的。希望对大家有用,我也不知道是算哪个版本的,一个个jar包找过来的,如果需要可以下载亲自测试可以用,完整的jar包,网上很多jar下载都用不了,要不就是版本不匹配,然后自己一个个调试然后一个个找过来的。希望对大家有用,我也不知道是算哪个版本的,一个个jar包找过来的,如果需要可以下载0 542浏览会员免费
- datax大小:27KBdatax二次开发hdfswriter支持parquet文件且支持自动创建目录datax二次开发hdfswriter支持parquet文件且支持自动创建目录0 440浏览会员免费
- MQTT 3.1.1 标准文档,了解 MQTT 协议的整个各种包协议,以及每个字段的作用,这份文档主要提供给客户端开发人员,服务端开发人员使用0 630浏览会员免费
- JDBC驱动大小:13MB这是用于与HIVE建立JDBC连接的驱动jar包,经过测试,是可以使用的。这是用于与HIVE建立JDBC连接的驱动jar包,经过测试,是可以使用的。0 1550浏览会员免费
- Presto的服务治理与架构优化及在京东的实践与应用,希望对大家有帮助0 278浏览会员免费
- hive大小:78MBhive安装包。也可以去官网或者其他镜像下载。我这里上传的是我使用的版本。hive安装包。也可以去官网或者其他镜像下载。我这里上传的是我使用的版本。0 201浏览会员免费
- Hive大小:21KB针对微博数据的停用词表针对微博数据的停用词表0 470浏览会员免费
- hive大小:177KBhive-hbase-handler-1.2.1.jar解决hive1.2.1,hbase不兼容情况!hive-hbase-handler-1.2.1.jar解决hive1.2.1,hbase不兼容情况!4 667浏览会员免费
- 大数据数据接入模板(直接表抽取方式),数据仓库抽取源系统相关信息要求0 489浏览会员免费
- 数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它决不是所谓的“大型数据库”。 数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。 数据仓库 比较流行的有:AWS Redshift, Greenplum, Hive等 (1)面向主题:指数据仓库中的数据是按照一定的主题域进行组织。 (2)集成:指对原有分散的数据库数据经过系统加工, 整理得到的消除源数据中的不一致性。 (3)相对稳定:指一旦某个数据进入数据仓库以后只需要定期的加载、刷新。 (4)反映历史变化:指通过这些信息,对企业的发展历程和未来趋势做出定量分析预测。0 560浏览会员免费
- hive驱动大小:51MB大数据hive的一个连接工具dbeaver,以及连接驱动,适合idea开发,连接cdh集群hive使用大数据hive的一个连接工具dbeaver,以及连接驱动,适合idea开发,连接cdh集群hive使用0 1227浏览会员免费
- 海量数据处理-hive数据仓库 很好的讲解的大数据海量数据处理的数据仓库模型建设0 398浏览会员免费
- 000000_0大小:27MB来源:电商用户行为埋点数据,包括:1.事件类型:install安装|launch启动|interactive交 互|page_enter_h5页面曝光|page_enter_native页面进入|exit退出等。2.行为类型:click点击|view浏览|slide滑动|input输入来源:电商用户行为埋点数据,包括:1.事件类型:install安装|launch启动|interactive交 互|page_enter_h5页面曝光|page_enter_native页面进入|exit退出等。2.行为类型:click点击|view浏览|slide滑动|input输入1 995浏览会员免费
- 实现elasticsearch与hive数据互通 环境 实验性单节点集群 vagrant.linux16.4.4(无doctor) hive2.3.3+beeline es6.2.2 kibana6.2.2 elasticsearch-hadoop-6.2.2.jar 没有doctor0 2347浏览会员免费
- 大数据大小:926KBHive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;HiveHive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive1 405浏览会员免费
- sqoop操作指南0 374浏览会员免费
- hive大小:6MBhive调优总结,网络上分享的hive常见优化细节,join、shuffle优化等等。很不错hive调优总结,网络上分享的hive常见优化细节,join、shuffle优化等等。很不错3 241浏览会员免费
- Greenplum是一种基于PostgreSQL的分布式数据库,采用Shared-Nothing架构(MPP), 主机、操作系统、内存、存储都是自我控制的,不存在共享。Greenplum主要由Master Host、Segment Host、Interconnect三大部分组成。本文详细的介绍了GreenPlum的架构并分析了扩容、迁移等诸多细节。0 233浏览会员免费
- 站点编号经纬度大小:215KB数据为excle格式全国气象站点的编号 名称 经纬度 站点级别国家气象站 国家基本气象站 国家基准气象站数据为excle格式全国气象站点的编号 名称 经纬度 站点级别国家气象站 国家基本气象站 国家基准气象站0 601浏览会员免费
- hive大小:23MBhive连接jdbc的jar包hive-jdbc-1.1.0-cdh5.12.1-standalone.jarhive连接jdbc的jar包hive-jdbc-1.1.0-cdh5.12.1-standalone.jar0 683浏览会员免费
- 很详细的hive内置函数大全,适用于工作、学习;常做hive统计分析的你,值得拥有. 很详细的hive内置函数大全,适用于工作、学习;常做hive统计分析的你,值得拥有.2 981浏览会员免费
- hive大小:129MB可用于数据库客户端连接、FineReport 等报表工具连接 包含 Jar 包列表: 01、hadoop-common-3.0.0-cdh6.3.1.jar 02、hive-exec-2.1.1-cdh6.3.1.jar 03、hive-jdbc-2.1.1-cdh6.3.1.jar 04、hive-jdbc-2.1.1-cdh6.3.1-standalone.jar 05、hive-metastore-2.1.1-cdh6.3.1.jar 06、hive-service-2.1.1-cdh6.3.1.jar 07、libfb303-0.9.3.jar 08、log4j-1.2.17.jar 09、slf4j-api-1.7.25.jar 10、slf4j-log4j12-1.7.25.jar 11、ST4-4.0.8.jar可用于数据库客户端连接、FineReport 等报表工具连接 包含 Jar 包列表: 01、hadoop-common-3.0.0-cdh6.3.1.jar 02、hive-exec-2.1.1-cdh6.3.1.jar 03、hive-jdbc-2.1.1-cdh6.3.1.jar 04、hive-jdbc-2.1.1-cdh6.3.1-standalone.jar 05、hive-metastore-2.1.1-cdh6.3.1.jar 06、hive-service-2.1.1-cdh6.3.1.jar 07、libfb303-0.9.3.jar 08、log4j-1.2.17.jar 09、slf4j-api-1.7.25.jar 10、slf4j-log4j12-1.7.25.jar 11、ST4-4.0.8.jar0 1303浏览会员免费
- Hive源码大小:15MBapache-hive-1.2.1源码包(已编译)(含Hive的使用全解)apache-hive-1.2.1源码包(已编译)(含Hive的使用全解)1 516浏览会员免费
- HIVE函数大全,包括目前HIVE可用的所有函数,里面有详细说明。HIVE是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。0 939浏览会员免费
- 构建业务型数据仓库EDW,有资深人士提供的企业应用案例。0 220浏览会员免费
- 大佬总结的hive的各种常用函数语法格式及其用法,Hive内部提供了很多函数给开发者使用,包括数学函数,类型转换函数,条件函数,字符函数,聚合函数,表生成函数等等0 1003浏览会员免费
- impalaODBC大小:12MB解决impala 客户端查询问题,包内包含连接客户端和impala 连接所需ODBC,安装上就能用解决impala 客户端查询问题,包内包含连接客户端和impala 连接所需ODBC,安装上就能用5 168浏览会员免费
- 大数据大小:16MBKylin官方团队权威出版《Apache Kylin权威指南》! 权威出版,大数据入门经典教程Kylin官方团队权威出版《Apache Kylin权威指南》! 权威出版,大数据入门经典教程3 0浏览会员免费
- hive大小:300MB为解决hive安全问题,重新编译hive源码升级jetty到9.4.24.v20191120为解决hive安全问题,重新编译hive源码升级jetty到9.4.24.v201911200 385浏览会员免费
- 查找性能低下的原因;分析性能低下的根源;从配置及程序角度进行优化。5 1800浏览会员免费
- 文章Hive面试题SQL测试题目所需数据,包含建表语句 测试数据等等...................0 2433浏览免费
- hive大小:27MB通过jdbc链接hive时所需要的jar包,把需要的jar都放在一个文件夹里。需要的可以自己下载。 如何连接成功可以看文章 https://blog.csdn.net/Oceanside_yh/article/details/90202397通过jdbc链接hive时所需要的jar包,把需要的jar都放在一个文件夹里。需要的可以自己下载。 如何连接成功可以看文章 https://blog.csdn.net/Oceanside_yh/article/details/902023970 742浏览会员免费
- 专有云大数据版(Apsara Stack Insight)是面向中小型企业用户,提供大数据端到端、全链路业务的轻量级软硬件一体化解决方案。 专有云大数据版基于阿里云飞天分布式操作系统Apsara开发,能够提供完备的大数据计算服务能力以及丰富的大数据应用。它的出现极大地降低了客户使用大数据产品的成本和门槛,这也使阿里云大数据产品普惠到各行各业。 专有云大数据版目前已经实现一键快捷部署、规模扩展和统一运维管控平台,并达到国家安全等保三级要求。5 164浏览会员免费
- excel大小:165KB你是否在数据开发时,某些场景突然需要一张全球机场的字典表?那么我的作用就体现了,好不容易梳理了迄今为止最全的全球机场字典表,并且是excel文档,供各位有需要的人根据场景使用。是不是相当友好?你是否在数据开发时,某些场景突然需要一张全球机场的字典表?那么我的作用就体现了,好不容易梳理了迄今为止最全的全球机场字典表,并且是excel文档,供各位有需要的人根据场景使用。是不是相当友好?0 549浏览会员免费
- hive大小:23MBhive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。0 392浏览会员免费
- hive大小:926KBhive初始化元数据到mysql5.7.25版本时mysql的驱动jar。hive初始化元数据到mysql5.7.25版本时mysql的驱动jar。0 833浏览会员免费
- 大数据项目之电商数仓5 515浏览会员免费
- Hive大小:434KBhive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。Hive的优点是学习成本低,可以通过类似SQL语句实现快速MapReduce统计,使MapReduce变得更加简单,而不必开发专门的MapReduce应用程序。hive是十分适合数据仓库的统计分析和Windows注册表文件。 该文档是我整理的Hive的知识图谱,内容相对比较齐全,包括hive的开发知识和优化知识点。hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。Hive的优点是学习成本低,可以通过类似SQL语句实现快速MapReduce统计,使MapReduce变得更加简单,而不必开发专门的MapReduce应用程序。hive是十分适合数据仓库的统计分析和Windows注册表文件。 该文档是我整理的Hive的知识图谱,内容相对比较齐全,包括hive的开发知识和优化知识点。0 327浏览会员免费
- 该文档目录如下: 1.1 基于Hadoop的数据仓库Hive学习指南 1.2实验环境 1.3实验原理 1.3.1 Hive简介 1.3.2 Hive安装 1.3.3安装并配置mysql 1.3.5 Hive简单编程实践 1.3.4 Hive的常用HiveQL操作5 611浏览会员免费
- 数据治理大小:206MB数据治理是组织中涉及数据使用的一整套管理行为。由企业数据治理部门发起并推行,关于如何制定和实施针对整个企业内部数据的商业应用和技术管理的一系列政策和流程。 现收集中国数据治理方法以及众多数据治理案例,以帮助我们学习。主要数据治理案例如下: 1、元数据管理(中国电信) 2、中信银行ODS方案、中信银行数据质量元数据管理平台用户操作手册 3、中国银行核心系统总体介绍 4、银行核心业务系统介绍 5、银行ODS整体架构及实施案例-mdc数据仓库技术架构及方案 6、大数据治理(高清PDF) 7、保险核心系统解决方案交流 8、数据治理平台系统介绍 9、 数据质量管理规范 以上为主要文件,包中包含23个文件,可供参考学习。数据治理是组织中涉及数据使用的一整套管理行为。由企业数据治理部门发起并推行,关于如何制定和实施针对整个企业内部数据的商业应用和技术管理的一系列政策和流程。 现收集中国数据治理方法以及众多数据治理案例,以帮助我们学习。主要数据治理案例如下: 1、元数据管理(中国电信) 2、中信银行ODS方案、中信银行数据质量元数据管理平台用户操作手册 3、中国银行核心系统总体介绍 4、银行核心业务系统介绍 5、银行ODS整体架构及实施案例-mdc数据仓库技术架构及方案 6、大数据治理(高清PDF) 7、保险核心系统解决方案交流 8、数据治理平台系统介绍 9、 数据质量管理规范 以上为主要文件,包中包含23个文件,可供参考学习。0 138浏览会员免费
- 为了便于学习,开发及优化hive sql,现在提供hive工具的研发参考手册工大家参考。5 180浏览会员免费
- hive大小:48KBWin10不需要Cygwin搭建大数据测试环境搭建hive的bin文件(包含官方版本中缺少的cmd文件),完美解决windows环境下配置hive时,找不到hive命令问题Win10不需要Cygwin搭建大数据测试环境搭建hive的bin文件(包含官方版本中缺少的cmd文件),完美解决windows环境下配置hive时,找不到hive命令问题5 432浏览会员免费