没有合适的资源?快使用搜索试试~ 我知道了~
MongoDB、PIG、HIVE Storage、Map Reduce、Spark、Yarn性能分析模拟-研究论文
需积分: 10 0 下载量 136 浏览量
2021-06-10
02:23:39
上传
评论
收藏 499KB PDF 举报
温馨提示
试读
6页
如今,信息的大小或数量、复杂性、种类、增长率或真实性各不相同。 这些公司在处理数据方面取得了出色的成绩。 原因是传统的技术和分析设备无法完成这项工作。 大数据一直在快速增长。 无法确定其大小。 Hadoop 能够评估大尺寸数据。 Hadoop 一直被认为是一个框架。 它已被应用于处理跨多个集群的大数据集。 Hadoop、Map Reduce 等工具能够管理如此庞大的数据量。 与此一起,Apache Hive、No SQL 也是这种收费。 信息提取被认为是必不可少的。 其原因在于非结构化文本数据的快速增长。 因此,它被认为是一个计算密集型和 MapReduce 并行的数据库管理系统。 这些被应用于评估巨大的信息量。 本文熟悉了pache hive、Apache pig等大数据工具。 此处根据一些参数对 hive 和 pig 进行了比较。 经过比较,发现蜂巢比猪表现更好。 Hadoop MapReduce 和 Spark 的主要区别在于处理方式。 Spark 能够在内存中执行此操作。 但是,Hadoop MapReduce 需要读取和写入磁盘。 因此,处理的速度是不同的。 Spark 比 MapReduce 快 100 倍
资源推荐
资源评论
资源评论
weixin_38625448
- 粉丝: 8
- 资源: 956
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功