IBM基于Hadoop工作的简介
标题:IBM基于Hadoop工作的简介 描述:IBM公司基于Hadoop工作的简单介绍 知识点: 一、IBM在Hadoop上的工作价值增加(Adding IBM Value To Hadoop) IBM在Hadoop平台上添加了多层价值,旨在满足不同角色用户的需求,包括业务分析师、硬件、IT基础设施管理员、开发者等。IBM通过提供一系列工具和服务,如数据收集、操作和可视化,集合目录,工作流创建工具(如PIG, JAQL, Hive),以及系统管理功能,使用户能够更高效地利用Hadoop平台进行数据分析和处理。 二、IBM对Apache Hadoop的贡献与分布(IBMDistributionofApacheHadoop) IBM不仅采用了Apache Hadoop的核心技术,还在此基础上进行了深度开发和优化,推出了IBM BigInsights产品。BigInsights包括应用服务器、应用程序与解决方案、支持基础设施等模块。IBM对Hadoop的增强主要体现在安装与配置、监控、管理控制台、数据库与仓库集成等方面,同时引入了如Toro、Gumshoe、下一代信用风险分析等特色应用,以及定制化应用程序。通过法律和知识产权审查,确保用户使用安全。 三、IBM BigInsights软件栈(BigInsights Software Stack) IBM BigInsights软件栈包含了多个层次的组件,从核心的Hadoop平台到上层的应用程序与解决方案,再到合作伙伴和社区的支持,形成了一个完整的生态系统。其中,BigSheets作为BigInsights的一部分,提供了直观的数据查看和分析界面。 四、FlexScheduler:一种灵活的作业调度器 FlexScheduler是IBM为优化Hadoop作业调度而设计的一种新型调度器。它在传统的FIFO(先进先出)和FAIR(公平调度)基础上,提供了一种更灵活的调度策略。FIFO专注于最小化完成时间,但可能造成交互式环境中任务的饥饿现象;FAIR调度器则确保每个作业获得公平的资源分配,避免任务饥饿,但并不针对特定的调度指标进行优化。FlexScheduler则能够在给定约束条件下,针对不同的标准调度指标进行优化,如加权响应时间、加权迟到任务数量等,从而实现更加高效和公平的资源调度。 五、FlexScheduler的两大创新理念 FlexScheduler提出了两个创新的理念来改进Hadoop作业调度的效率和公平性。它将自身置于FAIR调度器之上,利用其提供的基础公平性,再根据具体需求进一步优化。FlexScheduler引入了多种调度指标,通过动态调整资源分配策略,实现对不同指标的优化,例如最小化平均完成时间。这种灵活的调度策略,使得Hadoop平台能够更好地适应各种应用场景,提高整体性能。 总结: IBM在Hadoop领域的工作不仅限于技术层面的贡献,更在于如何通过创新和优化,提升Hadoop平台的实际应用价值。无论是通过BigInsights提供的一系列工具和服务,还是FlexScheduler带来的调度优化,IBM都致力于为企业和用户提供更高效、更智能的大数据处理方案。
剩余25页未读,继续阅读
- 粉丝: 4
- 资源: 21
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 可直接运行 MATLAB数学建模学习资料 模拟算法MATLAB代码实现.rar
- 基于 Java+SQLServer 实现的医药售卖系统课程设计
- HCNP(HCDP)华为认证资深网络工程师-路由交换方向培训 -IESN中文理论书-内文.pdf
- 新版FPGA课程大纲,芯片硬件开发用的大纲
- ROS2下OpenCV识别物体区域和视频捕捉的样例
- STM32-EMBPI.PDF
- Font Awesome图标字体库提供可缩放矢量图标,它可以被定制大小、颜色、阴影以及任何可以用CSS的样式
- Bluefield 2固件镜像版本,fw-MBF2M345A-VENOT-ES-Ax-24.40.1000.bin
- 雪颜奇迹幻白双重莹白焕采霜50ML-1016-FA.rar
- Qt的QDOCK高级用法源码,包含linux和windows版本,从开源库下载
- 1
- 2
- 3
前往页