Apache Eagle是一款开源的分布式实时监控和告警引擎,专为Hadoop平台设计。最初由eBay公司发起,目的是监控Hadoop生态系统中的各种活动,包括数据安全性、访问活动、平台健康状况、可用性以及性能表现等。Eagle能够实时识别对敏感数据的访问,识别潜在的攻击和恶意行为,并能够实时地阻止这些访问。它由eBay于2013年末开始着手开发,于2015年10月作为Apache Incubator项目正式开源。 Eagle的诞生背景是eBay内部Hadoop系统的快速发展,其庞大的节点数量和数据量使得现有监控工具(如zabbix、ganglia)无法有效处理和监控。从2007年到2015年,eBay的Hadoop系统规模增长显著,节点数从1-10增长到15,000,核心数从1,000增长到200,000以上,存储容量从1PB激增至2,000PB,用户数也超过了2,000个。这种规模的增长迫切需要一个能够高效处理大数据环境下的监控需求的工具。 Apache Eagle在功能需求方面具备灵活性,比如支持灵活的阈值设置,滑动窗口分析,多因素关联分析,实时与历史数据的结合,以及复杂监控场景的支持。而在非功能需求方面,它需要能够规模化运行,即拥有分布式架构,以支持其在大型分布式系统中的使用。 Eagle的架构设计使其具有高度的可扩展性,它能够分布式地在集群中运行,并且可以针对不同监控对象和场景进行灵活部署。Eagle还构建了完整的生态系统,让开发者和运维人员可以通过这一平台共享、复用各种监控组件和规则,简化监控实施过程,提高工作效率。 Eagle的监控系统主要包含以下几个关键组件: 1. 数据收集层:负责从不同的Hadoop组件(如HDFS、YARN、HBase、Kafka等)中收集性能指标和日志信息。 2. 数据处理层:对收集到的数据进行分析处理,比如过滤、聚合、异常检测等。 3. 数据存储层:将处理过的数据保存在可靠的存储系统中,以备后续查询、分析和告警使用。 4. 告警与通知系统:将系统检测到的问题或异常通过邮件、短信、事件日志等方式通知给相关人员。 5. 可视化组件:提供一个友好的用户界面,使用户能够直观地查看Hadoop集群的运行状况,包括各种性能指标和告警信息。 在GOPS2016全球运维大会上,eBay的陈浩(***)作为Apache Eagle项目的联合创始人,贡献者和PMC成员,分享了Eagle的介绍、架构、生态系统以及在eBay的实际应用案例。他的演讲旨在向业界展示Eagle如何有效地解决大规模Hadoop环境下的实时监控问题,并与大会参与者讨论了该框架在行业中的应用前景和挑战。 随着大数据技术的发展和应用,Eagle这类分布式实时监控和预警框架的应用将变得更加广泛。它不仅能帮助运维团队更好地管理大数据集群,确保系统的稳定性和数据的安全性,还能为数据分析提供强大的实时监控支持,使得业务决策更加迅速和精确。
剩余35页未读,继续阅读
- 粉丝: 3
- 资源: 34
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- YOLO-yolo资源
- 适用于 Java 项目的 Squash 客户端库 .zip
- 适用于 Java 的 Chef 食谱.zip
- Simulink仿真快速入门与实践基础教程
- js-leetcode题解之179-largest-number.js
- js-leetcode题解之174-dungeon-game.js
- Matlab工具箱使用与实践基础教程
- js-leetcode题解之173-binary-search-tree-iterator.js
- js-leetcode题解之172-factorial-trailing-zeroes.js
- js-leetcode题解之171-excel-sheet-column-number.js