![](https://csdnimg.cn/release/downloadcmsfe/public/img/no-data.51c5211b.png)
![](https://csdnimg.cn/release/downloadcmsfe/public/img/good-course.ff455529.png)
- tableau官方教程-中文版-10.5.pdfTableau官方使用手册,适用于入门学习。Tableau Desktop 和Web 制作帮助
0 5503浏览
会员免费 - hadoop-notebook.pdfBlock数据块 1. 基本存储单位,一般大小为64M(配置大的块主要是因为:1)减少搜寻时间,一般硬盘传输速率比寻道时间要快, 大的块可以减少寻道时间;2)减少管理块的数据开销,每个块都需要在NameNode上有对应的记录;3)对数据块 进行读写,减少建立网络的连接成本) 2. 一个大文件会被拆分成一个个的块,然后存储于不同的机器。如果一个文件少于Block大小,那么实际占用的空间为 其文件的大小 3. 基本的读写单位,类似于磁盘的页,每次都是读写一个块 4. 每个块都会被复制到多台机器,默认复制3份
0 74浏览
会员免费 - Hadoop面试100题.pdfHadoop面试100题.pdf
0 142浏览
会员免费 - 中国移动大数据平台安全基线要求.pdf中国移动大数据平台安全基线要求规范及明细,精心整理发布版
0 898浏览
会员免费 - CDH6.3安装指南.pdf最详细的CDH6.3安装指南,可以一步步按照文档进行安装,并且整理了安装介质(通过百度网盘下载)。
3 1281浏览
会员免费 - 基于大数据平台的自适应访问控制研究.pdf大数据时代的到来,使得数据成为了重要的经济资产, Apache Hadoop凭借其出色的数据存储能力和分布式计算等优势已经成为处理大量数据的主要平台,该平台存储着来自不同企业、组织或机构的数据,这些数据中往往包含许多私人或敏感信息,其数据安全问题不容忽视。访问控制是保护系统中数据安全的关键技术,但传统的访问控制模型和主流的开源授权框架主要依靠系统权威(系统管理员)制定访问策略,这不仅会增加对系统管理员的强依赖,且难以保证授权工作的时效性。因此,本文考虑时间动态变化特点,采用基于动态标签的用户异常状态评价,提出了一种面向Hadoop的自适应权限控制方案,并设计了 套大数据权限管理工具,能够实现根据用户实时行为标签动态调整用户访问权限,从而更加有效地保护大数据环境下的用户敏感信息和隐私数据。
0 159浏览
会员免费 - 大数据安全管理指南.pdf大数据安全管理指南,包括大数据安全概念、角色和责任、安全风险、平台运行安全
1 622浏览
会员免费 - 实用 _ 如何安装Cloudera Enterprise 5.pdf该脑图是介绍如何安装Cloudera Enterprise,请贡献给大家下载!
0 71浏览
会员免费 - 政府数据 数据脱敏工作指南.pdf本标准规定了政府数据的脱敏原则、脱敏方法和脱敏过程,可为数据脱敏工作的规划、实施和管理 提供指导。本标准适用于政府结构化数据的脱敏工作,包括但不限于数据脱敏的提供商、用户、评测机构和监 管机构。
5 2038浏览
会员免费 - 健康大数据与数据挖掘.pdf一本关于数据挖掘在临床医学领域实践应用的典型案例研究的报告PPT。
0 209浏览
会员免费 - HCIA-BigData 2.0 实验手册.pdfHCIA-BigData 2.0 实验手册.
0 126浏览
会员免费 - 搭建Hadoop云计算平台.pdf手把手教你搭建Hadoop云计算平台,这里有搭建hadoop集群详细步骤!
0 143浏览
会员免费 - BeeGFS作为Hadoop文件系统.pdfHadoop可以配置为使用BeeGFS作为其分布式文件系统,作为比使用HDFS更方便,更快捷的替 代方案。本页介绍了如何实现和测试此类配置。
0 399浏览
会员免费 - 尚硅谷大数据之Oozie.pdfdashuju 大数据oozie尚硅谷主讲,内容总结详细
0 263浏览
会员免费 - Hadoop 3.0大数据平台性能.pdf针对发布的Hadoop 3.0,本文研究了Hadoop 3.0 大数据平台性能。首先,采用华为云服务器搭建大数据平台;其次,利用Hadoop 框架提供的基准性能测试程序进行性能验证,测试指标包括TestDFSIO、MRBench 和TeraSort。最后,对比分析不同负载、不同数据量对平台性能的影响。实验结果表明,Hadoop3.0在HDFS 读写能力、MapReduce 计算能力上均表现出较优的性能。
0 385浏览
会员免费 - DataETL 用户指南.pdfkettle 工具抽取数据到hadoop hive,hbase,使用kettle抽取案例
0 67浏览
会员免费 - Hadoop集群搭建.pdfHadoop集群搭建 pdf
0 60浏览
会员免费 - 大数据.pdf大数据理论知识讲解,及Hadoop的配置,4V属性讲解,Nosql
0 280浏览
会员免费 - DataPipeline产品介绍V2.0.pdfDataPipeline产品介绍V2.0 产品手册 pdf版本
1 798浏览
会员免费 - 大数据架构设计大数据架构设计,包括云计算与大数据的关系;各行业大数据计算架构案例等
0 97浏览
会员免费 - flume1.9.0用户中文指南.pdfApache Flume 1.9.0用户中文指南.pdf。flume是一个分布式,可靠且可用的系统,用于有效地从许多不同的数据源收集、聚合和移动大量日志数据到集中式数据存储。 官网翻译版
0 353浏览
会员免费 - Hadoop与Spark所有系统组件部署手册.pdfHadoop与Spark所有系统组件部署手册.pdf
0 130浏览
会员免费 - 大数据基础培训.pdf大数据基础培训,包含常用组件的介绍,适合对数据有点了解或入门者
0 40浏览
会员免费 - Tensorflow-Josh 特别详细版本.pdf本文档中主要详细描述了在TensorFlow实现的一些算法、图操作、以及一些练习题
0 70浏览
会员免费 - 金蝶主数据管理解决方案.pdf金蝶主数据管理解决方案.pdf 金蝶主数据管理解决方案.pdf
0 486浏览
会员免费 - 人社大数据解决方案.pdf详细讲解人社领域如何建设大数据,如何构建完整的大数据平台。
0 295浏览
会员免费 - Hive 企业实战案例.pdfSpark权威指南:hadoop从入门到精通课程,hadoop是大数据的基本,包括mapreduce,hdfs
1 442浏览
会员免费 - Hadoop技术内幕:深入解析YARN架构设计与实现原理.pdfHadoop技术内幕:深入解析YARN架构设计与实现原理.从应用的角度讲解YARN的基本方法
0 0浏览
会员免费 - 大数据教程-Hadoop伪分布式安装.pdf大数据教程-Hadoop伪分布式安装,安装、部署详细细节步骤
0 181浏览
会员免费 - 深入理解大数据大数据处理与编程实践+完整版.pdf《深入理解大数据大数据处理与编程实践》,很不错的资料,希望对你的工作学习有所帮助。
0 364浏览
会员免费 - Hadoop权威指南 大数据的存储与分析-第4版-修订版-升级版.pdfHadoop权威指南 大数据的存储与分析 第四版
4 721浏览
会员免费 - Hadoop权威指南 大数据的存储与分析-第4版-修订版-升级版.pdfHadoop权威指南 大数据的存储与分析 第四版
0 112浏览
会员免费 - Hadoop权威指南.pdf有目录,非常不错的入门大数据书籍。 hadoop详细讲解,一边看书理解,一遍搭建学习。
0 56浏览
会员免费 - Gartner-数据分析领域10大技术趋势.pdfGartner-数据分析领域10大技术趋势.pdf
0 148浏览
会员免费 - 大数据爬虫解决方案.pdf描述了以爬虫为基础的大数据据解决方案,涉及到功能,部署、技术等的描述说明。
0 119浏览
会员免费 - SophonManual.pdftranswarp sophon version 1.0机器学习平台使用说明书
0 74浏览
会员免费 - 方舟V3.1核心功能说明书.pdf曙光大数据——方舟V3.1核心功能说明书.pdf
0 130浏览
会员免费 - Hadoop权威指南(第3版)《Hadoop权威指南(第3版 修订版)》通过丰富的案例学习来解释Hadoop的幕后机理,阐述了Hadoop如何解决现实生活中的具体问题。第3版覆盖Hadoop的最新动态,包括新增的MapReduceAPI,以及MapReduce2及其灵活性更强的执行模型(YARN)。
0 52浏览
会员免费 - Hadoop+Spark生态系统操作与实践指南-余辉.pdfHadoop、Spark、hive、mapReduce经典学习资料
0 287浏览
会员免费 - 《Hadoop生态系统》_陈新.pdfHadoop是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。 Hadoop的核心是HDFS和Mapreduce,hadoop2.0还包括YARN。
0 154浏览
会员免费 - Princeton.University.Press.Data.Visualization.A.Practical.Introduction.pdfPrinceton.University.Press.Data.Visualization.A.Practical.Introduction.pdf
0 151浏览
会员免费 - CLOUDERA-Manager-中文手册+CDH安装手册(Inter实验室版本).pdfCLOUDERA-Manager-中文手册+CDH安装手册 中文版本 CLOUDERA-Manager-中文手册+CDH安装手册 中文版本
1 705浏览
会员免费 - Cloudera_Administrator_Training_cdh5.pdfCloudera Administrator Training for Apache Hadoop 英文版
0 151浏览
会员免费 - 《趣味FPGA》.pdf入门级FPGA学习材料,简单明了,易学易会!了解FPGA从这本书开始
0 164浏览
会员免费 - Big Data Analysis for Bioinformatics and Biomedical Discoveries.CRC(2016).pdfThis series aims to capture new developments and summarize what is known over the entire spectrum of mathematical and computational biology and medicine. It seeks to encourage the integration of mathematical, statistical, and computational methods into biology by publishing a broad range of textbooks, reference works, and handbooks. The titles included in the series are meant to appeal to students, researchers, and professionals in the mathematical, statistical and computational sciences, fundamental biology and bioengineering, as well as interdisciplinary researchers involved in the field. The inclusion of concrete examples and applications, and programming techniques and examples, is highly encouraged.
0 119浏览
会员免费 - 大数据可视化产品设计方案大数据可视化产品设计方案详解,对大数据产品架构及其在教育、医疗、交通、政府等各行业的解决方案进行了讲解。
0 417浏览
会员免费 - Hadoop技术内幕 深入解析YARN架构设计与实现原理.pdf这是一本关于Hadoop源码解析的书籍,这本书从源码的角度讲解了Hadoop底层到底是如何工作的,这对我们学习和理解Hadoop有一个很好的帮助。
0 190浏览
会员免费 - 大数据预测.pdf360公司董事长周鸿祎、《罗辑思维》主讲人罗振宇郑重推荐 2020年的一天,在你驱车前往公司的路上,导航系统通过预测交通流量,会自动帮你选择一条最合适的交通路线;车内推荐系统会根据你的饮食习惯预测你可能会喜欢吃什么,并推荐沿途的早餐店;你的电子社交助理已经为你自动选择了你可能感兴趣的社交网信息;当车内系统预测到你驾车有些分心时,座椅会自动震动进行提醒…… 以上这些情景不是科幻大片独有的,它们有的已经或会在未来的某一天成为现实。而这一切所倚靠的就是预测分析技术。 大数据时代下,作为其核心,预测分析已在商业和社会中得到广泛应用。随着越来越多的数据被记录和整理,未来预测分析必定会成为所有领域的关键技术。 作为预测分析领域的专家,埃里克•西格尔博士深谙预测分析界已经实现和正在发生的事情、面临的问题和将来可能的前景。在《大数据预测》一书中,他结合预测分析的应用实例,对其进行了深入、细致且全面的解读。 关于预测分析,你想了解的全部,你的生活以及这个世界会因为预测分析改变到什么程度,《大数据预测》都会告诉你。
0 0浏览
会员免费 - GIAC架构大会-承载每天万级任务的调度系统架构是如何设计的.pdf承载每天万级任务的调度系统架构是如何设计的 分布式任务调度系统如何设计? 开源分布式任务调度系统介绍
0 149浏览
会员免费 - 文本大数据分析-02文本处理.pdf在大数据时代,海量文本的积累在各个领域不断涌现。从人文研究到政府决策,从精准...如果您在实际工作中遇到了大量的中文文本,但缺乏有效的分析工具,
0 445浏览
会员免费 - 2-童小军-运用Hadoop构建数据仓库平台.pdf童小军-运用Hadoop构建数据仓库平台 基于Hadoop构建数据仓库云平台(DAAS) 思想,原理,成本,案例 专注于企业级大数据EasyHadop 社区创始人
0 150浏览
会员免费 - 一致性哈希算法及其在分布式系统中的应用本文将会从实际应用场景出发,介绍一致性哈希算法(Consistent Hashing)及 其在分布式系统中的应用。首先本文会描述一个在日常开发中经常会遇到的问题 场景,借此介绍一致性哈希算法以及这个算法如何解决此问题;接下来会对这个 算法进行相对详细的描述,并讨论一些如虚拟节点等与此算法应用相关的话题。
0 362浏览
会员免费 - ZooKeeper集群搭建ZooKeeper集群搭建
0 107浏览
会员免费 - YARN(MRv2)搭建YARN(MRv2)搭建
0 84浏览
会员免费 - Mapreduce经验MapReduce最早是由Google提出的用于一种分布式架构中的计算海量数据集的编程模型,它起源于函数式程程序的map 和reduce两个函数,但它们在MapReduce模型中的应用和原来的使用上的大相径庭。在MapReduce模型中,用户指定一 个Map(映射)函数,通过这个Map函数处理键值(KeyValue)对,产生一系列的中间键值对,并且使用一个Reduce(化 简/规约)函数来合并具有相同键(Key)的中间键值对中的值(Value)。
0 77浏览
会员免费 - MapReduce with MongoDBMapReduce 是 Google 在 2004 年发布的一个软件框架,用于支持大规模数据的分布式计算。 MongoDB 是一个开源的面向文档的 NoSQL 数据库系统,使用 C++ 编写。
0 86浏览
会员免费 - HDFS Comics HDFS 漫画HDFS是Hadoop分布式计算的存储基础。HDFS具有高容错性,可以部署在通用硬件设备上,适合数据密集型应用,并且提供对数据读写的高吞 吐量。HDFS能 够提供对数据的可扩展访问,通过简单地往集群里添加节点就可以解决大量客户端同时访问的问题。HDFS支持传统的层次文件组织结构,同现 有的一些文件系 统类似,如可以对文件进行创建、删除、重命名等操作。
0 319浏览
会员免费 - HDFS的Trash回收站功能的配置和使用HDFS是Hadoop分布式计算的存储基础。HDFS具有高容错性,可以部署在通用硬件设备上,适合数据密集型应用,并且提供对数据读写的高吞 吐量。HDFS能 够提供对数据的可扩展访问,通过简单地往集群里添加节点就可以解决大量客户端同时访问的问题。HDFS支持传统的层次文件组织结构,同现 有的一些文件系 统类似,如可以对文件进行创建、删除、重命名等操作。
0 955浏览
会员免费 - HDFS集群搭建HDFS是Hadoop分布式计算的存储基础。HDFS具有高容错性,可以部署在通用硬件设备上,适合数据密集型应用,并且提供对数据读写的高吞 吐量。HDFS能 够提供对数据的可扩展访问,通过简单地往集群里添加节点就可以解决大量客户端同时访问的问题。HDFS支持传统的层次文件组织结构,同现 有的一些文件系 统类似,如可以对文件进行创建、删除、重命名等操作。
5 308浏览
会员免费 - Hadoop常用命令.pdf1.运行MapReduce程序 > hadoop jar test-1.0-SNAPSHOT-jar-with-dependencies.jar /user/test/input /user/test/out 2.运行Jar包指定类中的主函数 > java -cp test-1.0-SNAPSHOT-jar-with-dependencies.jar com.test.main.MainTest
0 379浏览
会员免费