• Hadoo数据仓库-hive入门全面介绍

    hadoop hive 数据仓库 入门 hive是一个基于hadoop的数据仓库。使用hadoop-hdfs作为数据存储层;提供类似SQL的语言(HQL),通过hadoop-mapreduce完成数据计算;通过HQL语言提供使用者部分传统RDBMS一样的表格查询特性和分布式存储计算特性

    5
    142
    1.09MB
    2012-06-29
    21
  • ZooKeeper_程指南中文.rar

    hadoop ZooKeeper 编程指南 中文版 书籍市场上没有书籍可以参考 这本手册对大家应该很有帮助 我就是靠这边资料熟悉了ZooKeeper

    3
    99
    125KB
    2012-05-10
    9
  • 疯狂java讲义PDF高清版

    名师李刚,疯狂java讲义, PDF高清扫描版,Java编程好帮手。 入门学习,工作提高 必备

    3
    96
    1.11MB
    2012-05-10
    10
  • hadoop-1.0.2-eclipse-plugin.jar

    官方未提供hadoop-1.0.2的插件。基于eclipse3.3.2 个人修改整理的插件。 可以顺利连接master。

    4
    41
    7.74MB
    2012-04-24
    4
  • Hadoop分布式Cache

    DistributedCache 是一个提供给Map/Reduce框架的工具,用来缓存文件(text, archives, jars and so on)文件的默认访问协议为(hdfs://). DistributedCache将拷贝缓存的文件到Slave节点在任何Job在节点上执行之前。 文件在每个Job中只会被拷贝一次,缓存的归档文件会被在Slave节点中解压缩。

    4
    121
    16KB
    2012-04-17
    3
  • hadoop-0.20.1-eclipse-plugin.jar hadoop eclipse plugin

    注意:下载完毕后,如果进行“评论”且“评分”,您的资源分不会减少,而且会多一分! 在Eclipse环境中可以使用插件对hadoop直接操作文件系统,也可以即时运行任务。 从hadoop 0.19.1 升级到 0.20.1时才发现原来0.19.1的插件不能使用,包里没有jar文件,需要自行编译。然而编译出来的jar总是不能用,最后改写一点代码,才可以在Eclipse (europa, galileo)下正常使用。 注意:使用0.20.1的插件之后,要把原来的项目中的0.19.1.core.jar的Lib也更换掉。

    5
    49
    2.76MB
    2012-04-17
    5
  • hadoop开发者 一期 二期 三期 四期 pdf

    hadoop开发者 pdf 一期 二期 三期 四期 合集 pdf文件

    0
    89
    11.13MB
    2012-04-17
    6
  • Hadoop公平调度器指南.pdf

    公平调度是一种赋予作业(job)资源的方法,它的目的是让所有的作业随着时间的推移, 都能平均的获取等同的共享资源。当单独一个作业在运行时,它将使用整个集群。当有其它 作业被提交上来时,系统会将任务(task)空闲时间片(slot)赋给这些新的作业,以使得每 一个作业都大概获取到等量的 CPU 时间。与 Hadoop 默认调度器维护一个作业队列不同,这 个特性让小作业在合理的时间内完成的同时又不“饿”到消耗较长时间的大作业。它也是一 个在多用户间共享集群的简单方法。公平共享可以和作业优先权搭配使用——优先权像权重 一样用作为决定每个作业所能获取的整体计算时间的比例。 公平调度器按资源池(pool)来组织作业,并把资源公平的分到这些资源池里。默认情况 下,每一个用户拥有一个独立的资源池,以使每个用户都能获得一份等同的集群资源而不管 他们提交了多少作业。按用户的 Unix 群组或作业配置(jobconf)属性来设置作业的资源池也 是可以的。在每一个资源池内,会使用公平共享(fair sharing)的方法在运行作业之间共享容 量(capacity)。 你也可以给予资源池相应的权重,以不按比例的方式共享集群。 除了提供公平共享方法外,公平调度器允许赋给资源池保证(guaranteed)最小共享资源, 这个用在确保特定用户、群组或生产应用程序总能获取到足够的资源时是很有用的。当一个 资源池包含作业时,它至少能获取到它的最小共享资源,但是当资源池不完全需要它所拥有 的保证共享资源时,额外的部分会在其它资源池间进行切分。 在常规操作中,当提交了一个新作业时,公平调度器会等待已运行作业中的任务完成以 释放时间片给新的作业。但,公平调度器也支持在可配置的超时时间后对运行中的作业进行 抢占。如果新的作业在一定时间内还获取不到最小的共享资源,这个作业被允许去终结已运 行作业中的任务以获取运行所需要的资源。因此抢占可以用来保证“生产”作业在指定时间 内运行的同时也让Hadoop 集群能被实验或研究作业使用。另外,作业的资源在可配置的超时 时间(一般设置大于最小共享资源超时时间)内拥有不到其公平共享资源(fair share)的一半 的时候也允许对任务进行抢占。在选择需要结束的任务时,公平调度器会在所有作业中选择 那些最近运行起来的任务,以最小化被浪费的计算。抢占不会导致被抢占的作业失败,因为 Hadoop 作业能容忍丢失任务,这只是会让它们的运行时间更长。 最后,公平调度器还可以限制每用户和每资源池的并发运行作业数量。当一个用户必须 一次性提交数百个作业时,或当大量作业并发执行时,用来确保中间数据不会塞满集群上的 磁盘空间,这是很有用的。设置作业限制会使超出限制的作业被列入调度器的队列中进行等 待,直到一些用户/资源池的早期作业运行完毕。系统会根据作业优先权和提交时间的排列来 运行每个用户/资源池中的作业。

    4
    66
    307KB
    2012-04-17
    10
  • Hadoop权威指南+中文版+全部章节.pdf

    Hadoop 权威指南 中文版,内容全面,不是个别章节的截取。全部章节。

    0
    74
    40.36MB
    2012-04-17
    0
  • MongoDB权威指南中文版0

    呵呵。纯中文版的,找的很辛苦吧。0中文版。共享了!

    0
    0
    9.77MB
    2012-02-03
    10
上传资源赚积分or赚钱