![](https://csdnimg.cn/release/downloadcmsfe/public/img/no-data.51c5211b.png)
![](https://csdnimg.cn/release/downloadcmsfe/public/img/good-course.ff455529.png)
- 大数据处理三大瓶颈:大容量、多格式和速度.pdf大数据处理三大瓶颈:大容量、多格式和速度.pdf
0 73浏览
会员免费 - Amazon+EMR相关最佳实践.pdf数据迁移至 AWS; 数据收集、压缩与聚合相关策略; 以及数据处理所需 Amazon EMR 集群的常见设置 与配置架构模式等方面的最佳实践。其中亦将提供一系列示例,用于解释如何利用保留与现货实例等 Amazon EC2 购买 选项实现成本优化。
0 163浏览
会员免费 - 大数据在商业银行中的应用探究_胡筱彤.pdf在商业银行日常业务中,通过对客户的基本信息,客户金 融行为的大数据分析,可以实现对银行客户的画像和产品需求 的精准性分析,从而将银行产品销售给适合的客户。同时,也 在精准掌握客户需求的前提下,设计出更受欢迎的产品,实现 银行产品新旧迭代和创新。
0 147浏览
会员免费 - 论文解读pre:Clustering Very Large Multi-dimensional Datasets with MapReduce用latex beamer生成的pdf版本的ppt,关于论文Clustering Very Large Multi-dimensional Datasets with MapReduce。是我的pre
0 71浏览
会员免费 - HDFS体系架构汉化文档.pdfHadoop分布式文件系统( HDFS )是一种旨在在商品硬件上运行的分布式文系统。它与现有的分布式文件系统许多相似之处。 但是,与其他分布式文件系统的区别很明显。 HDFS 具有高度的容错能力,旨在部署低成本硬件上。 具有高度的容错能力,旨在部署低成本硬件上。 具有高度的容错能力,旨在部署低成本硬件上。HDFS 放宽了一些 POSIX要求,以实现对文件系统数据的流式访问。 HDFS最初是作为 Apache Nutch Web搜索引擎项目的基础结构而构建的。 HDFS是 Apache Hadoop Core项目 的一部分。项目URL 是http://hadoop.apache.org/http://hadoop.apache.org/
0 110浏览
会员免费 - Hadoop技术选型分析报告V4.0.pdf本文包含整个Hadoop生态所涉及的所有开源组件及原生Apache Hadoop产品与Cloudera发行的Hadoop产品、国产华为Hadoop、大快搜索Hadoop等综合分析架构及原理等。
0 160浏览
会员免费 - 搭建Hadoop集群,写mapreduce程序处理数据搭建了一个完全分布式Hadoop集群,并通过Java写了mapreduce程序处理数据,需要下载的可以找我要具体数据。
0 422浏览
会员免费 - 大数据产业背景与思维改变——齐红威.pdf大数据产业背景与思维改变 1. 大数据基础设施类(NoSQL数据库、Hadoop相关产品、NewSQL数据库、MPP数据 库、管理监控等) 2. 大数据分析类(分析解决方案、数据可视化、统计计算、社交媒体、舆情分析、分析 服务、IT分析等) 3. 大数据应用类(广告优化、出版工具、市场营销、行业应用、大数据应用服务提供商) 4. 大数据数据源类(数据市场、数据源) 5. 跨基础设施分析(主要为传统IT巨头业务延伸) 6. 开源项目(框架、查询/数据流、数据访问、协作/工作流、实时、统计工具、机器学习、 云部署)
0 122浏览
会员免费 - Hadoop期末学习重点.pdfHadoop期末学习重点.pdf
0 871浏览
会员免费 - 三节点大数据环境安装教程1.pdf大数据环境搭建
0 112浏览
会员免费 - Hadoop技术选型分析报告.pdf根据市场上目前比较流行的几款Hadoop产品综合分析,从部署的便捷性、功能、性能及成本等方面综合考量,推荐使用CDH与HDP。然后再根据我们具体的使用场景来进行选择,如果我们追求功能全面与部署案例参考推荐使用CDH,因为CDH目前是市场上功能最全、部署案例最多的一款产品,如果我们追求部署快捷,易上手使用推荐使用HDP,因为HDP是迄今为止100%纯开源ApacheHadoop的唯一提供商并且是第一家使用了ApacheHCatalog的元数据服务特性的提供商。并且,它们的Stinger开创性地极大地优化了Hive项目。Hortonworks为入门提供了一个非常好的,易于使用的沙盒。
0 361浏览
会员免费 - Hadoop综合分析报告.pdfHadoop系列发行版综合分析对比,1.据个人了解HDP是100%完全开源的,而CDH还不是100%完全开源。Hortonworks 的工程师是社区的主要贡献者,Cloudera 的发行版本也是比较清晰的。 2.HDP 使用开源工具 Ambari 安装,CDH 使用 ClouderaManager 工具安装。对配置 的修改与更新 Ambari 的界面更友好,可以很方便的修改集群配置, ClouderaManager 的配置界面不是太方便,有些配置没法改。 3.支持的组件,HDP 基本上支持所有的开源大数据组件,CDH 也基本上支持所有 的开源大数据组件。 4.代码包依赖,如果是 HDP 平台,编写代码直接依赖 hadoop 版本即可,如果是 CDH 平台,编写代码要依赖 cdh 的版本,否则运行不成功。
0 230浏览
会员免费 - HCNP-Big Data-Developer教材华为大数据开发者 HCNP-Big Data-Developer HCNP Big Data Developer 教材
0 153浏览
会员免费 - 最详细的伪分布模式Hadoop安装记录.pdf分布式部署,必须把各个节点的 authorized_keys 的内容互相拷贝加入到对方的此文件中,然后就可以免密码彼此 ssh连入,具体用文件 cat 操作,所有节点的 authorized_keys,即包含了各自节点生成的 rsa.pub(authorized_keys)内容 合并一个 authorized_keys 后拷贝到所有节点
0 52浏览
会员免费 - Hadoop Shell命令速查表.pdfhadoop shell 命令速查表,大数据 shell 使用方向,重在使用和操作,希望对大家学习和工作有所帮助。
0 462浏览
会员免费 - 基于Storm和Hadoop的大数据处理架构的研究_靳永超.pdf基于Storm和Hadoop的大数据处理架构的研究_靳永超.pdf
0 189浏览
会员免费 - 如何写saiku的schema(第4课).pdf如何写saiku的schema(第4课).pdf 1:step by step 写写saiku的schema文件 2:课程讲解需要提前准备的内容 3:课程讲解需要操作方法 4:课程讲解需要操作步骤 5:课程讲解需要操作后的效果 6:课程讲解需要操作后如何进行下一操作
0 125浏览
会员免费 - 如何写saiku的schema(第1课).pdf1:step by step 写写saiku的schema文件 2:课程讲解需要提前准备的内容 3:课程讲解需要操作方法 4:课程讲解需要操作步骤 5:课程讲解需要操作后的效果 6:课程讲解需要操作后如何进行下一操作
1 161浏览
会员免费 - HadoopStudy.pdfhadoop电子书,入门学习教程,大数据技术基础入门,hdfs、yarn、mapreduce等组件详细介绍
0 39浏览
会员免费 - hadoop伪分布式搭建_原理_格式化问题解决方案.pdf这里有hadoop的简介,比如MR,Yarn,HDfs,还有一些详细的介绍。以及伪分布式的搭建,同样是图文的方式去写的,配置基本上是一层接一层的去做的,所以有阶段性,可以一阶段一阶段的去配。
0 372浏览
会员免费 - hadoop完全分布式搭建_HA搭建.pdfhadoop完全分布式以及HA搭建步骤:代码也有,过程都是图文形式,不过我这里提供的只是最基础的一种配置方式,并不能代表全部,因为具体的hadoop配置还有好多,我这里把最基本的展现出来
0 156浏览
会员免费 - Hadoop使用笔记这是鄙人在学习和使用Hadoop过程中记录的内容,可能不适合很多人,仅提供参考,如有问题也可提出,探讨。
0 103浏览
会员免费 - hadoop安装配置说明-加词云.pdfHADOOP 安装配置实践手册 0 Linux 基础 1 Hadoop 安装配置 2 HDFS 编程 3 MYSQL 4 HIVE 5 Sqoop 6 Storm 7 Kafka 8 RDS 9 词云
0 425浏览
会员免费 - Impala A Modern, Open-Source SQL Engine for Hadoop.pdfImpala A Modern, Open-Source SQL Engine for Hadoop
0 114浏览
会员免费 - 网易大数据平台实践.pdf网易大数据平台实践介绍了网易大数据发展历程、体系、技术组件、应用场景和未来规划,由网易知名专家主讲。是难得的学习实践资料。
0 366浏览
会员免费 - 三盟科技高职教学诊改培训.pdf符合国家验收标准:平台得到各级诊改专家好评,产品符合国家及16个省及自治区诊改政 策要求,产品落地55所,22所院校接受国家或省级复核验收工作。 2. 技术实力雄厚:500+研发人员、500个画像分析维度、98个产品功能模块可满足一校一 策院校需求。 3. 指标体系丰富:拥有业界丰富的指标体系供学校参考,386个指标,12套不同类型院校指 标版本。 4. 业务系统对接零障碍:有90%以上主流业务系统对接经验,100%抓取学校已有数据,全 面支撑校内质量建设工作。 5. 一平台多用:支撑诊改还能服务于智慧校园应用,如教学大数据分析、学工大数据分析、 双高校建设、优质校建设、骨干校建设等15种大数据应用场景。
0 128浏览
会员免费 - 美团大数据架构演示PPT.pdf美团大数据架构演示PPT,用于展示美团现有的大数据架构,来源来自于2019SACC.
1 1067浏览
会员免费 - 从裸机搭建完全分布式模式Hadoop.pdf以下为部分标题: 1.搭建单机模式Hadoop 1.搭建准备工作 (1)关闭防火墙(2)关闭selinux防火墙 2.安装JDK (1)下载jdk (2)上传JDK至服务器 a.下载WinSCP软件 b.建立linux与windows之间文件互传 (4)配置JAVA环境变量3.安装Hadoop (1)上传Hadoop安装包至Linux (3)配置Hadoop环境变量 2.搭建完全分布式模式Hadoop 1.克隆出三台虚拟机 2.分别映射好三台虚拟机的IP与主机名 3.设置三台机器时钟同步 4.设置三台机器两两之间SSH密码登录 5.修改主节点配置文件并远程拷贝到从节点 (2).将主节点的配置文件分发到两个从节点 6.格式化HDFS并启动Hadoop (1)在主节点上格式化HDFS
0 366浏览
会员免费 - 搭建伪分布模式Hadoop.pdf以下为文章部分标题 1.搭建单机模式Hadoop (1)关闭防火墙(2)关闭selinux防火墙(3)设置主机名(4)映射主机名与ip地址 2.安装JDK(2)上传JDK至服务器(4)配置JAVA环境变量 3.安装Hadoop(3)配置Hadoop环境变量 2.搭建伪分布式模式Hadoop 1.到hadoop目录中2.修改hadoop-env.sh配置文件 (2)core-site.xml1.修改core-site.xml配置文件(3)hdfs-site.xml1.修改hdfs-site.xml配置文件(4)mapred-site.xml(5)yarn-site.xml 4.启动与关闭分布式Hadoop(2)启动DFS及Yarn 5.配置SSH免密登入(4)配置SSH免密登录5.验证伪分布模式Hadoop是否安装部署成功
0 278浏览
会员免费 - 零基础入门数据挖掘_Datawhale.pdfDatawhale 零基础入门数据挖掘-Baseline Baseline-v1.0 版 Tip:这是一个最初始baseline版本,抛砖引玉,为大家提供一个基本Baseline和一个竞赛流程的基本介绍,欢迎大家 多多交流。 赛题:零基础入门数据挖掘 - 二手车交易价格预测 地址:https://tianchi.aliyun.com/competition/entrance/231784/introduction? spm=5176.12281957.1004.1.38b02448ausjSX (https://tianchi.aliyun.com/competition/entrance/231784/introduction? spm=5176.12281957.1004.1.38b02448ausjSX)
0 460浏览
会员免费 - 大数据竞赛大数据竞赛平台建设方案
0 219浏览
会员免费 - Oracle big data case - Oracle No sql 实战Oracle big data case - Oracle No sql 实战。 How to access NoSQL Data from Oracle Database in Hadoop platform
0 76浏览
会员免费 - hadoop3.2.1伪分布集群各组件安装教程.pdf根据实战安装步骤,详细描述hadoop3.2.1、hive3.1.2(包括mysql5.7)、zookeeper3.6、hbase2.2.4、flume1.90、sqoop1.4.7各组件安装步骤,记录过程中的各种坑,方便各位看官快速安装部署hadoop伪分布集群。
0 731浏览
会员免费 - Hadoop-new.pdf因为默认的虚拟机主机名都是ubuntu,所以为了便于虚拟机的识别,创建完成虚拟机后我们对虚拟机名进行修改,我们把用于主节点的虚拟机名称设为master(按自己的喜好创建),把用于从节点的虚拟机名称设为slave1
0 75浏览
会员免费 - Apache Impala Guide impala-3.3.pdfApache Impala Guide impala-3.3
0 193浏览
会员免费 - Hadoop HDFS和MapReduce架构浅析.pdfHadoop HDFS和MapReduce架构浅析.pdf 更多资源请点击:https://blog.csdn.net/weixin_44155966
0 169浏览
会员免费 - HadoopMapReduce短作业执行性能优化.pdfHadoopMapReduce短作业执行性能优化.pdf 更多资源请点击:https://blog.csdn.net/weixin_44155966
0 105浏览
会员免费 - Apache impala-3.2 Guide.pdfImpala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。已有的Hive系统虽然也提供了SQL语义,但由于Hive底层执行使用的是MapReduce引擎,仍然是一个批处理过程,难以满足查询的交互性。相比之下,Impala的最大特点也是最大卖点就是它的快速。 [1]
0 562浏览
会员免费 - 5-Nonintrusive load monitoring of electrical devices in health smart homes.pdfNonintrusive load monitoring of electrical devices in health smart homes
0 59浏览
会员免费 - xshell和xftp与虚拟机的连接.pdf大数据技术要建立在Linux的基础之上,而我们的windows操作系统与Linux不可以直接相互传递消息,xftp这个软件可以有效的解决这个问题,本文就可以解决最基本的连接问题,xshell也是学习大数据必备的软件,通过xshell我们可以更轻松的完成我们的学习和工作任务,本文详细解决了连接问题。
5 1143浏览
会员免费 - Hadoop3.0安装部署.pdfHadoop3.0安装部署, 所需安装文件在我的博客中
0 228浏览
会员免费 - ADBPG&DataWorks 数仓方案解析.pdfAnalyticDB 是实时数仓产品-更轻!更快!更简单! AnalyticDB+Dataworks 一站式实时数仓开发方案架构 数据类型全面 • 支持图像数据索引检索 • 支持声纹数据索引检索 • 支持 JsonB 类型索引检索 • 支持文本类型索引检索 • 支持GIS类型索引检索
0 498浏览
会员免费 - 人工智能(合并版).pdfOverview of Artificial Intelligence 人工智能完整ppt讲义 高清
0 157浏览
会员免费 - hadoop数据分析与挖掘项目实践.pdf一个完整的hadoop项目实战全流程。是学习、备课不可多得的资源材料。内容包含hadoop/hive/sqoop/mysql等组件的实践。
0 0浏览
会员免费 - 深入浅出Otter与Canal.pdf深入浅出Otter与Canal.pdf深入浅出Otter与Canal.pdf深入浅出Otter与Canal.pdf深入浅出Otter与Canal.pdf
0 627浏览
会员免费 - 彭渊-如何突破腾讯大数据分析架构瓶颈-发布版.pdf彭渊-如何突破腾讯大数据分析架构瓶颈
0 191浏览
会员免费 - 华为的维护宝典.pdf作为运维的查阅资料,方便排除解决现场问题。hadoop、habse、hive、kafka等都有帮助。常见的用法都有,可以借鉴,感谢大佬的提供,华为牛逼
0 233浏览
会员免费 - 巴豆大数据团队讲师课件Yarn.pdf内有Hadoop对应的知识要点,为巴豆大数据团队讲师课件,内容丰富,知识覆盖全面,可以直接使用。 内有Yern对应的知识要点,为巴豆大数据团队讲师课件,内容丰富,知识覆盖全面,可以直接使用。
0 146浏览
会员免费 - 巴豆大数据团队讲师课件HDFS.pdf内有Hadoop对应的知识要点,为巴豆大数据团队讲师课件,内容丰富,知识覆盖全面,可以直接使用。
0 82浏览
会员免费 - 大数据运维手册-你值得拥有一组可与您的Hadoop集群交互的网络应用程序。Hue应用能让您浏览HDFS和工作,管理Hive metastore,运行Hive,浏览HBase Sqoop出口数据,提交MapReduce程序,构建自定义的搜索引擎与Solr,与Oozie一起调度重复性的工作流。
1 413浏览
会员免费 - CDH-5.10.2集群的搭建.pdf使用原生的ApacheHadoop,有以下痛点需要解决: 1、集群规模很庞大时搭建Hadoop集群复杂度越来越高,工作量很大 2、规模很大的集群下升级Hadoop版本很费时费力 3、需要自己保证版本兼容,比如升级Hadoop版本后需要自己保证与Hive、Hbase等的兼容 4、安全性很低 Apache官方和一些第三方就发布了一些Hadoop发行版本来解决此类问题。一些有名的发行版本列举如下: • Apache Hadoop • Cloudera’s Distribution Including Apache Hadoop(CDH) • Hortonworks Data Platform (HDP) • MapR • EMR 而CDH是Hadoop众多分支中的一种,由Cloudera维护,基于稳定版本的Apache Hadoop构建,全称Cloudera’s Distribution, including Apache Hadoop。 CDH提供了Hadoop的核心可扩展存储(HDFS)和分布式计算(MR),还提供了WEB页面进行管理、监控。
0 228浏览
会员免费 - 09-Hadoop编程.pdfHadoop编程思维导图,便捷整理思路,WordCount案例、Mapreduce案例、PageRank案例、TF-IDF案例、ItemCF案例
0 91浏览
会员免费 - 大数据技术之Flume.pdf大数据技术之Flume
0 74浏览
会员免费 - 毛宝龙-EC融入HDFS-脱敏.pdfEC融入HDFS EC融入HDFS EC融入HDFS EC融入HDFS EC融入HDFS EC融入HDFS EC融入HDFS EC融入HDFS
0 110浏览
会员免费 - 范斌-计算和存储分离架构下大数据栈的演化-脱敏.pdf计算存储分离架构下的大数据演化
0 451浏览
会员免费 - 07-Hadoop安装部署.pdfHadoop安装思维导图,便捷整理思路,实操hadoop伪分布、Hadoop全分布、Hadoop-HA、Hadoop-HA故障转移
0 74浏览
会员免费 - 06-分布式云平台HADOOP.pdfHadoop思维导图,便捷整理思路,里面记载了hadoop由来、存储和架构模型、HDFS设计思想、持久化
0 60浏览
会员免费 - 胡克秋-TonY:原生于Hadoop的深度学习执行框架-脱敏.pdf大数据深度学习
0 92浏览
会员免费 - 滴滴大数据研发平台最佳实践 - 曾文秋.pdf滴滴大数据研发平台最佳实践
0 316浏览
会员免费 - 大数据技术之Hadoop(MapReduce).pdf大数据技术之Hadoop(MapReduce)
0 125浏览
会员免费