下载 > 资源分类 >  大数据 >  Storm > 从零开始学Storm(第2版)

从零开始学Storm(第2版)

2017-12-05 上传大小:161.75MB

第1章  Storm简介
1.1  什么是Storm 1
1.2  Storm的诞生 3
1.2.1  从Twitter说起 3
1.2.2  Twitter需要处理大批实时性要求高的大数据业务 3
1.2.3  Storm帮助Twitter解决实时海量大数据处理问题 4
1.3  Storm的成长 5
1.3.1  Storm正式开源 5
1.3.2  Apache接管并孵化Storm 5
1.
3.3  Storm的核心技术和基本组成 6
1.3.4  Storm的项目小组 7
1.3.5  Storm的技术支持网站 10
1.4  Storm的优势 13
1.4.1  集成多种技术 13
1.4.2  简单的API 13
1.4.3  可扩展的 14
1.4.4  容错的 14
1.4.5  保证数据处理 14
1.4.6  可以使用任何语言 14
1.4.7  部署和操作简单 15
1.4.8  自由开源 15
1.5  Storm的应用现状和发展趋势 15
1.5.1  应用现状 16
1.5.2  发展趋势 18
1.6  如何学习Storm 20
1.7  本书的章节安排及学习建议 21
1.7.1  本书的章节安排 21
1.7.2  关于如何阅读本书的建议 22
1.8  本章小结 23
第 2 章  Storm的基本知识
2.1  概念 24
2.1.1  元组(Tuple) 24
2.1.2  流(Stream) 25
2.1.3  龙卷(Spout) 26
2.1.4  闪电(Bolt) 27
2.1.5  拓扑(Topology) 27
2.1.6  主控节点与工作节点 28
2.1.7  Nimbus进程与Supervisor进程 28
2.1.8  流分组(Stream grouping) 28
2.1.9  工作进程(Worker) 28
2.1.10  任务(Task) 28
2.1.11  执行器(Executor) 28
2.1.12  可靠性(Reliability) 29
2.2  Storm的配置 29
2.2.1  Storm的配置类型 29
2.2.2  defaults.yaml文件 30
2.2.3  storm.yaml文件 33
2.2.4  Config类 34
2.3  序列化(Serialization) 35
2.3.1  动态类型 36
2.3.2  自定义序列化 36
2.3.3  Java序列化 37
2.3.4  特定组件序列化注册 37
2.4  容错机制 37
2.4.1  Worker进程死亡 37
2.4.2  节点死亡 38
2.4.3  Nimbus或者Supervisor守护进程死亡 38
2.4.4  Nimbus是否是“单点故障” 38
2.5  可靠性机制——保证消息处理 38
2.5.1  消息被“完全处理”的含义 38
2.5.2  如果一个消息被完全处理或完全处理失败会发生什么 39
2.5.3  Storm如何保证可靠性 40
2.5.4  Storm如何实现可靠性 43
2.5.5  调节可靠性 44
2.6  消息传输机制 45
2.6.1  ZeroMQ 45
2.6.2  Netty 45
2.6.3  自定义消息通信机制 45
2.7  Storm的开发环境与生产环境 46
2.7.1  开发环境与本地模式 46
2.7.2  生产环境与远程模式 46
2.7.3  开发环境与生产环境的对比 47
2.8  Storm拓扑的并行度(parallelism) 48
2.8.1  工作进程、执行器和任务 48
2.8.2  配置拓扑的并行度 49
2.8.3  拓扑示例 50
2.8.4  如何改变运行中拓扑的并行度 51
2.9  Storm命令行客户端 52
2.10  Javadoc文档 56
2.11  本章小结 56
第 3 章  拓扑详解
3.1  什么是拓扑 57
3.2  TopologyBuilder 57
3.3  流分组 59
3.3.1  什么是流分组 59
3.3.2  不同的流分组方式 60
3.4  一个简单的拓扑 64
3.5  在本地模式下运行拓扑 67
3.6  在生产集群上运行拓扑 68
3.6.1  常见的配置 70
3.6.2  杀死拓扑 70
3.6.3  更新运行中的拓扑 71
3.6.4  监控拓扑 71
3.7  拓扑的常见模式 71
3.7.1  流连接(Stream Join) 71
3.7.2  批处理(Batching) 72
3.7.3  BasicBolt 72
3.7.4  内存中缓存与字段的组合 72
3.7.5  流的top N 72
3.7.6  高效保存近更新缓存对象的TimeCacheMap(已弃用) 74
3.7.7  分布式RPC的CoordinatedBolt与KeyedFairBolt 75
3.8  本地模式与StormSubmitter的对比 75
3.9  多语言协议(Multi-Language Protocol) 77
3.10  使用非JVM语言操作Storm 81
3.10.1  支持的非Java语言 81
3.10.2  对Storm使用非Java语言 81
3.10.3  实现非Java DSL的笔记 82
3.11  Hook 82
3.12  本章小结 83
第 4 章  组件详解
4.1  基本接口 84
4.1.1  IComponent接口 84
4.1.2  ISpout接口 85
4.1.3  IBolt接口 86
4.1.4  IRichSpout与IRichBolt接口 88
4.1.5  IBasicBolt接口 88
4.1.6  IStateSpout与IRichStateSpout接口 89
4.2  基本抽象类 90
4.2.1  BaseComponent抽象类 90
4.2.2  BaseRichSpout抽象类 90
4.2.3  BaseRichBolt抽象类 91
4.2.4  BaseBasicBolt抽象类 92
4.3  事务接口 92
4.3.1  IPartitionedTransactionalSpout 92
4.3.2  IOpaquePartitionedTransactionalSpout 94
4.3.3  ITransactionalSpout 95
4.3.4  ICommitterTransactionalSpout 96
4.3.5  IBatchBolt 97
4.4  组件之间的相互关系 97
4.5  本章小结 98
第 5 章  Spout详解
5.1  可靠的与不可靠的消息 99
5.2  Spout获取数据的方式 102
5.2.1  直接连接(Direct Connection) 102
5.2.2  消息队列(Enqueued Messages) 103
5.2.3  DRPC(分布式RPC) 104
5.3  常用的Spout 104
5.3.1  Kestrel作为Spout的数据源 104
5.3.2  AMQP作为Spout的数据源 104
5.3.3  JMS作为Spout的数据源 105
5.3.4  Redis作为Spout的数据源 105
5.3.5  beanstalkd作为Spout的数据源 105
5.4  学习编写Spout类 105
5.5  本章小结 106
第 6 章  Bolt详解
6.1  Bolt概述 107
6.2  可靠的与不可靠的Bolt 108
6.2.1  使用Anchoring机制实现可靠的Bolt 108
6.2.2  使用IBasicBolt接口实现自动确认 109
6.3  复合流与复合Anchoring 110
6.3.1  复合流 110
6.3.2  复合Anchoring 110
6.4  使用其他语言定义Bolt 111
6.5  学习编写Bolt类 111
6.5.1  可靠的Bolt 111
6.5.2  不可靠的Bolt 112
6.6  本章小结 113
第 7 章  ZooKeeper详解
7.1  ZooKeeper简介 114
7.2  ZooKeeper的下载和部署 114
7.2.1  ZooKeeper的下载 114
7.2.2  ZooKeeper的部署 115
7.3  ZooKeeper的配置 117
7.4  ZooKeeper的运行 119
7.5  ZooKeeper的本地模式实例 120
7.6  ZooKeeper的数据模型 121
7.6.1  ZNode 122
7.6.2  ZooKeeper中的时间 123
7.6.3  ZooKeeper的Stat结构 123
7.7  ZooKeeper的命令行操作范例 124
7.8  Storm在ZooKeeper中的目录结构 127
7.9  本章小结 128
第 8 章  基础软件的安装与使用
8.1  Linux的基本操作 129
8.1.1  环境变量 129
8.1.2  常用命令 130
8.2  JDK的下载与配置 134
8.2.1  Sun JDK的下载 134
8.2.2  在Linux下安装JDK 135
8.2.3  在Windows下安装JDK 136
8.3  GitHub托管项目的下载 141
8.4  Maven的下载与配置 143
8.4.1  Maven的下载 143
8.4.2  在Linux下部署Maven 144
8.4.3  在Windows下部署Maven 145
8.5  其他软件——Notepad++ 146
8.6  本章小结 147
第 9 章  Storm的安装与配置
9.1  Storm集群的安装步骤与准备工作 148
9.1.1  搭建ZooKeeper集群 148
9.1.2  安装Storm的本地依赖 148
9.1.3  下载并解压Storm发行版本 151
9.1.4  配置storm.yaml文件 153
9.1.5  启动Storm的守护进程 154
9.2  本地模式的Storm完整的配置命令 157
9.3  本章小结 159
第 10 章  Storm集群搭建实践
10.1  准备工作 160
10.1.1  概述 160
10.1.2  配置hosts文件 161
10.1.3  配置静态IP 161
10.1.4  集群SSH无密码 163
10.1.5  修改主机名 164
10.1.6  关闭防火墙 164
10.1.7  同步时间 164
10.1.8  安装JDK 165
10.2  ZooKeeper集群的搭建 166
10.2.1  部署**个节点 166
10.2.2  部署第i个节点 167
10.2.3  启动ZooKeeper集群 167
10.2.4  查看ZooKeeper状态 168
10.2.5  关闭ZooKeeper集群 168
10.2.6  清理ZooKeeper集群 168
10.3  Storm集群的搭建 168
10.3.1  安装Storm依赖(每个Storm节点) 168
10.3.2  部署**个节点 169
10.3.3  部署第i个节点 171
10.3.4  启动Storm守护进程 171
10.4  本章小结 172
第 11 章  准备Storm的开发环境
11.1  Storm的开发环境 173
11.1.1  什么是Storm的开发环境 173
11.1.2  如何管理Storm 173
11.1.3  如何提交拓扑到集群 176
11.2  Eclipse的下载与配置 176
11.2.1  Eclipse的下载 176
11.2.2  Eclipse的配置与运行 177
11.2.3  Eclipse插件的安装 178
11.3  使用Maven管理项目 180
11.3.1  Maven的下载与配置 180
11.3.2  配置pom.xml文件 180
11.3.3  运行Maven命令 182
11.4  使用Nexus搭建本地Maven私服 183
11.4.1  下载Nexus 183
11.4.2  运行Nexus 184
11.4.3  登录Nexus后台 184
11.4.4  配置Repositories 185
11.4.5  配置setting.xml文件 187
11.4.6  修改Eclipse的Maven插件的配置 189
11.5  使用SVN管理代码版本 189
11.5.1  在Windows下搭建SVN服务器 189
11.5.2  在Linux下搭建SVN服务器 191
11.5.3  安装SVN客户端 191
11.6  部署单节点的Storm集群 192
11.6.1  部署伪分布的ZooKeeper 192
11.6.2  部署伪分布的Storm集群 192
11.7  本章小结 194
第 12 章  开发自己的Storm应用
12.1  新建Maven项目 195
12.2  修改为适合Storm开发的项目 198
12.2.1  对包名进行分类管理 198
12.2.2  修改pom.xml文件 199
12.3  编写代码 201
12.3.1  编写Spout类 201
12.3.2  编写Bolt类 202
12.3.3  编写Topology类 203
12.4  本地测试运行 204
12.5  提交到Storm集群运行 205
12.5.1  使用Maven打包 205
12.5.2  提交jar包到集群 205
12.6  本章小结 206
第 13 章  storm-starter详解
13.1  storm-starter项目概述 207
13.2  storm-starter的下载 209
13.3  使用Maven进行管理 211
13.3.1  使用Maven打包storm-starter 211
13.3.2  使用Maven直接运行ExclamationTopology 211
13.3.3  使用Maven运行单元测试 211
13.4  在Eclipse中运行 212
13.4.1  新建Maven项目的方式 212
13.4.2  导入已存在的项目的方式 214
13.5  storm-starter的入门例子 214
13.5.1  ExclamationTopology 214
13.5.2  WordCountTopology 216
13.5.3  ReachTopology 219
13.6  storm-starter的其他例子 225
13.6.1  BasicDRPCTopology 225
13.6.2  ManualDRPC 226
13.6.3  PrintSampleStream 226
13.6.4  RollingTopWords 227
13.6.5  SkewedRollingTopWords 228
13.6.6  SingleJoinExample 229
13.6.7  TransactionalGlobalCount 230
13.6.8  TransactionalWords 230
13.6.9  WordCountTopologyNode 231
13.7  本章小结 232
第 14 章  研发与集群管理技巧
14.1  使用daemontools监控Storm进程 233
14.1.1  daemontools简介 233
14.1.2  安装daemontools 234
14.1.3  编写监控脚本 234
14.2  使用Monit监控Storm 236
14.2.1  Monit简介 236
14.2.2  安装Monit 237
14.2.3  配置Monit 238
14.2.4  启动Monit 240
14.2.5  获取Monit帮助信息 241
14.3  常用的集群操作命令 242
14.4  使用Storm的经验与建议 243
14.5  本章小结 244
第 15 章  DRPC详解
15.1  概述 245
15.2  DRPCTopologyBuilder 246
15.2.1  LinearDRPCTopologyBuilder 246
15.2.2  LinearDRPCTopologyBuilder提供的方法 246
15.2.3  LinearDRPCTopologyBuilder使用范例 248
15.2.4  LinearDRPCTopologyBuilder的工作原理 249
15.2.5  LinearDRPCTopologyBuilder目前已弃用 249
15.3  本地模式的DRPC 249
15.4  远程模式的DRPC 250
15.5  一个复杂的DRPC例子(计算reach值) 250
15.6  非线性DRPC 253
15.7  本章小结 253
第 16 章  事务拓扑详解
16.1  什么是事务拓扑 254
16.1.1  设计1 254
16.1.2  设计2 255
16.1.3  设计3(Storm的设计) 256
16.2  事务拓扑的设计细节 256
16.3  事务拓扑的实现细节 257
16.3.1  事务Spout的工作原理 257
16.3.2  “对于给定的事务id不能发射相同的Batch”的处理 258
16.3.3  更多的细节 260
16.4  事务拓扑API 260
16.4.1  Bolt 260
16.4.2  事务Spout 261
16.4.3  配置 262
16.5  TransactionalTopologyBuilder 262
16.5.1  TransactionalTopologyBuilder提供的方法 262
16.5.2  TransactionalTopologyBuilder类已弃用 266
16.6  一个简单的例子 266
16.7  本章小结 269
第 17 章  Trident详解
17.1  Trident概述 270
17.1.1  简单的例子——单词统计(TridentWordCount) 270
17.1.2  另一个例子——计算Reach值(TridentReach) 274
17.1.3  字段和元组 275
17.1.4  状态(State) 276
17.1.5  Trident拓扑的执行 277
17.2  Trident API 279
17.2.1  概述 279
17.2.2  本地分区操作 279
17.2.3  重新分区操作 283
17.2.4  聚合操作 284
17.2.5  流分组操作 284
17.2.6  合并与连接 285
17.3  Trident的状态 285
17.3.1  Trident状态分类 286
17.3.2  事务Spout(Transactional Spout) 286
17.3.3  不透明事务Spout(Opaque Transactional Spout) 288
17.3.4  非事务Spout(Non-transactional Spout) 289
17.3.5  Spout与State之间的联系 289
17.3.6  State API 290
17.3.7  persistentAggregate方法 294
17.3.8  实现 MapStates 294
17.4  Trident Spout 295
17.4.1  流水线(Pipelining) 296
17.4.2  Trident Spout的类型 296
17.5  本章小结 296
第 18 章  Storm的内部实现
18.1  文件系统分析 297
18.2  数据目录结构 298
18.2.1  Nimbus节点的目录结构 299
18.2.2  Supervisor节点的目录结构 299
18.3  代码库的结构 300
18.3.1  storm.thrift 301
18.3.2  Java接口 316
18.3.3  实现 316
18.4  拓扑的生命周期 318
18.4.1  启动拓扑 319
18.4.2  监控拓扑 321
18.4.3  杀死拓扑 321
18.5  Acking框架的实现 322
18.5.1  异或计算的基本原理 322
18.5.2  Acking框架的实现原理 322
18.5.3  Acker的execute方法 323
18.5.4  待定元组(pending tuple)和RotatingMap 323
18.6  Metric 324
18.7  本章小结 329
第 19 章  Storm相关的其他项目
19.1  JStorm项目 330
19.1.1  项目简介 330
19.1.2  下载与部署 331
19.1.3  源代码编译 332
19.2  storm-deploy项目 332
19.3  Storm与Kafka 333
19.3.1  Kafka简介 333
19.3.2  Kafka的安装 333
19.3.3  启动服务 334
19.3.4  测试运行 335
19.3.5  Storm与Kafka的项目 337
19.4  storm-kestrel项目 338
19.4.1  storm-kestrel项目简介 338
19.4.2  使用storm-kestrel项目 338
19.4.3  Kestrel服务器和队列 339
19.4.4  添加元素到kestrel 339
19.4.5  从Kestrel中移除元素 340
19.4.6  持续添加元素到Kestrel 341
19.4.7  使用KestrelSpout 342
19.4.8  执行 342
19.5  本章小结 343
第 20 章  企业应用案例
20.1  Storm席卷众多互联网企业 344
20.1.1  Storm的典型应用场景 344
20.1.2  Storm的三大基本应用 345
20.2  Storm在Twitter中的应用 345
20.2.1  Twitter公司简介 345
20.2.2  Storm帮助Twitter提升产品性能 346
20.2.3  MapR在Twitter中的应用简介 346
20.3  Storm在阿里巴巴集团的应用 348
20.3.1  阿里巴巴集团简介 348
20.3.2  Storm在阿里巴巴的应用 348
20.3.3  Storm在淘宝公司的应用 350
20.3.4  Storm在支付宝公司的应用 350
20.4  其他应用Storm的知名企业和项目 351
20.5  本章小结 367
参考资料 368
...展开收缩
综合评分:0(0位用户评分)
开通VIP C币充值 立即下载

评论共有0条

登录后才能评论

 

相关推荐

从零开始学Storm(第2版) 立即下载
积分/C币:25
从零开始学Storm 立即下载
积分/C币:2
从零开始学Storm part2 立即下载
积分/C币:5
《从零开始学Storm》1 立即下载
积分/C币:3
从零开始学Storm Part1 立即下载
积分/C币:3
电子设计从零开始 第2版 (第2部分共2部分) 立即下载
积分/C币:3
从头开始学Storm 完整版pdf 立即下载
积分/C币:3
从零开始学VC系列教程完整版.doc 立即下载
积分/C币:3
[从零开始学模拟电子技术].李建清.扫描版.part3 立即下载
积分/C币:3
[从零开始学电路基础].刘建清.扫描版 part3 立即下载
积分/C币:3
从零开始学C# 孙景瑞.扫描版 立即下载
积分/C币:5
JavaScript从零开始学:视频教学版 立即下载
积分/C币:3
14天学会安卓开发_(完整版) 从零开始学android开发 立即下载
积分/C币:5
[从零开始学电路基础].刘建清.扫描版part1 立即下载
积分/C币:3
从零开始学安卓蒋惠全版 立即下载
积分/C币:3
从零开始学模拟电子技术 立即下载
积分/C币:2
从零开始学单片机C语言 立即下载
积分/C币:2
从零开始学电动机控制与维修技术 立即下载
积分/C币:2
从零开始学电路仿真Multisim与电路设计Protel技术 立即下载
积分/C币:2
MYSQL 5.5从零开始学 立即下载
积分/C币:2

热门专辑

VIP会员动态

关闭
img

spring mvc+mybatis+mysql+maven+bootstrap 整合实现增删查改简单实例.zip

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
扫码关注并点击右下角获取下载码
输入下载码
为了良好体验,不建议使用迅雷下载
img

从零开始学Storm(第2版)

会员到期时间: 剩余下载个数: 剩余C币:593 剩余积分:0
为了良好体验,不建议使用迅雷下载
VIP下载
您今日下载次数已达上限(为了良好下载体验及使用,每位用户24小时之内最多可下载20个资源)

积分不足!

资源所需积分/C币 当前拥有积分
您可以选择
开通VIP
4000万
程序员的必选
600万
绿色安全资源
现在开通
立省522元
或者
购买C币兑换积分 C币抽奖
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
(仅够下载10个资源)
为了良好体验,不建议使用迅雷下载
确认下载
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
为了良好体验,不建议使用迅雷下载
C币充值 开通VIP
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
您的积分不足,将扣除 10 C币
为了良好体验,不建议使用迅雷下载
确认下载
下载

兑换成功

你当前的下载分为234开始下载资源
你还不是VIP会员
开通VIP会员权限,免积分下载
立即开通

你下载资源过于频繁,请输入验证码

您因违反CSDN下载频道规则而被锁定帐户,如有疑问,请联络:webmaster@csdn.net!

举报

若举报审核通过,可奖励5下载分

  • 举报人:
  • 被举报人:
  • 举报的资源分:
  • *类型:
  • *详细原因: