【课程大纲】 01.Storm项目实战课程大纲 02.CDH5搭建之CM5安装部署 03.CDH5搭建和CM界面化集群管理 04.Hadoop、HBase、Zookeeper集群管理和角色分配 05.Kafka基础知识和集群搭建 06.Kafka基本操作和最优设置 07.Kafka Java API 简单开发测试 08.storm-kafka 详解和实战案例 09.S图表框架HighCharts介绍 10.HBase快速入门 11.基于HBase的Dao基类和实现类开发一 12.基于HBase的Dao基类和实现类开发二 13.项目1-地区销售额-需求分析和架构设计 14.项目1-地区销售额-Spout融合Kafka Consumer及线程安全测试 15.项目1-地区销售额-Bolt业务逻辑处理一 16.项目1-地区销售额-优化Bolt支持重启及结果数据核查 17.项目1-地区销售额-HighCharts图表开发一及Web端架构设计 18.项目1-地区销售额-HTTP长链接实现实时推送 19.项目1-地区销售额-HighCharts图表开发二及jquery运用 20.项目1-地区销售额-Web端完善和细节优化 21.项目1-地区销售额-项目发布及总结 22.项目1-地区销售额-项目需求分析和分区Trident Spout开发 23.项目1-地区销售额-Trident代码开发一 24.项目1-地区销售额-Trident代码开发二 25.项目1-地区销售额-基于HBase存储的State运用 26.项目2-省份销售排行-双纵轴HighCharts图表开发一 27.项目2-省份销售排行-双纵轴HighCharts图表开发二 28.项目2-省份销售排行-双纵轴HighCharts图表开发三 29.项目2-省份销售排行-前台和图表交互开发和Top N实现 30.项目2-省份销售排行-Top N展示优化和项目开发思路总结 31.项目2-效果展示及项目3需求分析梳理 32.项目3-非跳出UV-Storm topology开发一 33.项目3-非跳出UV-Storm topology开发二 34.项目3-非跳出UV-Web端Servlet开发 35.项目3-非跳出UV-Web端Highcharts图表开发 36.项目3-非跳出UV-项目效果调试 37.项目3-非跳出UV-项目整体运行 38.项目3-非跳出UV-升级图表增加柱图一 39.项目3-非跳出UV-升级图表增加柱图二 40.JStorm介绍 41.会员问题收集和解答 【Storm流计算项目:1号店电商实时数据分析系统】 在电商行业中,实时数据分析系统对于监控用户行为、评估营销效果以及优化用户体验至关重要。本项目聚焦于使用Storm进行实时流计算,特别是针对非跳出用户访问量(UV)的分析,旨在提供更深入的用户洞察。 Storm是一个分布式实时计算系统,它可以持续地处理数据流,并且保证每个事件至少被处理一次。在1号店的电商实时数据分析系统中,Storm用于处理从Kafka中获取的大量用户行为数据。Kafka作为消息队列,负责收集并分发这些数据,确保高吞吐量和低延迟。 项目分为多个阶段,通过CDH5搭建了Hadoop、HBase和Zookeeper集群,这些是大数据处理的基础平台。Hadoop提供分布式存储,HBase为NoSQL数据库,用于存储大规模结构化数据,Zookeeper则负责集群的协调和管理。Kafka集群的搭建与配置,使得数据能高效地从源头流向Storm。 在项目1中,开发了地区销售额的实时分析,使用Storm-Kafka连接器读取Kafka中的数据,然后通过Spout组件进行数据摄入。Bolt组件处理业务逻辑,如聚合、过滤等操作,同时为了支持系统的高可用性,进行了Bolt的优化,使其支持重启并验证结果数据。HighCharts被用于图表开发,实现数据可视化,HTTP长链接技术用于实现实时数据推送至Web端,使得用户可以即时查看分析结果。 项目2转向省份销售排行的分析,采用双纵轴HighCharts图表,展示更丰富的数据对比,同时实现Top N的展示功能,便于观察最畅销的商品或地区。 到了项目3,重点在于非跳出UV的实时监控。非跳出UV是指访问网站后未离开的独立访客数量,它是衡量网站黏性和用户体验的重要指标。在这个阶段,开发了Storm的topology,用于处理和计算非跳出UV。Web端使用Servlet处理请求,并集成Highcharts来呈现图表,实现用户友好的数据展示。在项目3的升级阶段,增加了柱状图,以更直观地展示不同时间段的非跳出UV变化趋势,从而帮助决策者了解用户行为模式。 整个项目过程中,JStorm也被提及,它是阿里巴巴开源的分布式实时计算框架,与Storm类似但具有更高的性能和稳定性,适用于对实时性要求极高的场景。 这个项目涵盖了大数据生态中的多个关键技术,包括数据采集、存储、计算和展示,通过Storm实现了电商领域的实时数据分析,提供了洞察用户行为的工具,对于提升业务效率和优化用户体验具有重要意义。
- 粉丝: 458
- 资源: 7362
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助