没有合适的资源?快使用搜索试试~
我知道了~
文库首页
课程资源
专业指导
MapReduce在分布式搜索引擎中的应用.pdf
MapReduce在分布式搜索引擎中的应用.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
分布式
分布式系统
分布式开发
参考文献
专业指导
0 下载量
9 浏览量
2021-08-10
23:27:29
上传
评论
收藏
275KB
PDF
举报
温馨提示
限时特惠:¥9.90
19.90
#资源达人分享计划#
资源推荐
资源评论
一种基于MapReduce的分布式索引方法.pdf
浏览:121
#资源达人分享计划#
分布式编程模式MapReduce应用[参考].pdf
浏览:145
分布式编程模式MapReduce应用[参考].pdf
基于MapReduce的分布式EM算法的研究与应用.pdf
浏览:124
5星 · 资源好评率100%
#资源达人分享计划#
分布式并行编程模型MapReduce及其应用研究.pdf
浏览:43
#资源达人分享计划#
基于MapReduce的分布式智能搜索引擎框架研究
浏览:6
5星 · 资源好评率100%
基于MapReduce的分布式智能搜索引擎框架研究.pdf
基于lucene和nutch的开源搜索引擎资料集合
浏览:48
5星 · 资源好评率100%
[硕士论文]_基于MapReduce的分布式智能搜索引擎框架研究.pdf [硕士论文]_基于Nutch的垂直搜索引擎的分析与实现.pdf 一个例子学懂搜索引擎(lucene).doc 中文搜索引擎技术揭密.doc 九大开源搜索引擎介绍.txt 基于Nutch...
大数据技术 Hadoop开发者第二期 MapReduce HDFS Hive Mahout HBase 共64页.pdf
浏览:11
2、Nutch + Hadoop 构建商用分布式搜索引擎的问题探究 ........... - 5 - 3、支持自定义爬虫的Nutch segment文件存储接口改写........... - 11 - 4、Nutch中mapreduce应用的几个特殊点 ...................... - 14 ...
论文研究-基于Hive的海量搜索日志分析系统研究.pdf
浏览:195
针对传统分布式模型在海量日志并行处理时的可扩展性和并行程序编写困难的问题, ...对用户搜索行为中的查询热点主题、用户点击数和URL排名、查询会话的分析结果对于搜索引擎的排序算法和系统优化都有一定的指导意义。
大数据开源框架集锦.pdf
浏览:182
Druid 实时⼤数据分析引擎 Elastic Search 分布式可扩展的实时搜索和分析引擎,基于Apache Lucene搜索引擎 9 数据收集 Flume 分布式海量⽇志采集、聚合和传输系统 Logstash 具有实时管道功能的开源数据收集引擎 10 ...
基于MapReduce的分布式ETL体系结构研究.pdf
浏览:130
#资源达人分享计划#
基于MapReduce的分布式ETL多维数据模型研究.pdf
浏览:71
#资源达人分享计划#
分布式编程环境MapReduce介绍.pdf
浏览:17
分布式编程环境MapReduce介绍.pdf
基于MapReduce的分布式期望最大化算法.pdf
浏览:150
5星 · 资源好评率100%
#资源达人分享计划#
基于MapReduce的分布式AP聚类算法.pdf
浏览:169
#资源达人分享计划#
第七章-《大数据导论》大数据处理平台.pdf
浏览:103
缓解数据访问瓶颈问题,提高执行效率 大数据处理平台技术架构 数据采集层 数据处理层 … 批量采集 网络爬虫 流采集 分布式文 件系统 关系 数据库 NoSQL 数据库 数据存储层 机器学习 数据挖掘 搜索引擎 批量处理引擎 ...
各大数据组件介绍.pdf
浏览:140
(概述图⽚来源:[2] ) 那么Zookeeper能做什么事情呢,简单的例⼦:假设我们有20个的(每个负责总索引中的⼀部分的搜索任务)和⼀个总服务器(负责向这20个 搜索引擎的服务器发出搜索请求并合并结果集),⼀个备⽤的总...
大数据发展历史.pdf
浏览:154
成熟阶段: 2006——2009年,⾕歌公开发表两篇论⽂《⾕歌⽂件系统》和《基于集群的简单数据处理:MapReduce》,其核⼼的技术包括分布式⽂ 件系统GFS,分布式计算系统框架MapReduce,分布式锁Chubby,及分布式数据库...
大数据技术之Hadoop介绍.pdf
浏览:12
搜索引擎数据:搜索引擎从不同数据库中抽取的⼤规模数据。 因此,⼤数据包括巨⼤规模、超⾼速度、类型可扩展的数据。⼤数据包括三种类型的数据: 结构化数据:关系型数据。 半结构化数据:XML数据。 ⾮结构化数据:...
大数据下的用户行为分析.pdf
浏览:106
(2)搜索引擎⽇志:搜索引擎⽇志系统所记录的⽤户在搜索引擎上的相关⾏为信息; (3)⽤户浏览⽇志:通过特定的⼯具和途径记录⽤户所记录的⽤户在该搜索引擎上的相关⾏为信息; (4)⽤户主体数据:如⽤户群的年龄...
基于MapReduce的分布式云计算数据挖掘方法.pdf
浏览:130
基于MapReduce的分布式云计算数据挖掘方法.pdf
基于MapReduce的分布式网络数据聚类算法.pdf
浏览:174
#资源达人分享计划#
一种基于MapReduce的分布式极图构造算法.pdf
浏览:121
#资源达人分享计划#
基于MapReduce的分布式贪心EM算法.pdf
浏览:127
#资源达人分享计划#
基于MapReduce模型的分布式天文交叉证认.pdf
浏览:103
#资源达人分享计划#
大数据的一些面试题.pdf
浏览:180
七、倒排索引(Inverted index) 适⽤范围:搜索引擎,关键字查询 基本原理及要点:为何叫倒排索引?⼀种索引⽅法,被⽤来存储在全⽂搜索下某个单词在⼀个⽂档或者⼀组⽂档中的存储位置的映射。 以英⽂为例,下⾯是要...
大数据下的数据分析平台架构.pdf
浏览:8
对于⼤多数反馈时间要求不是那么严苛的应⽤,⽐如离线统计分析、机器学习、搜索引擎的反向索引计算、推荐引擎的计算等,应采⽤离线 分析的⽅式,通过数据采集⼯具将⽇志数据导⼊专⽤的分析平台。但⾯对海量数据,...
大数据特征与发展历程.pdf
浏览:201
⽐如搜索引擎要求⼏分钟前的新闻能够被⽤户查询 到,个性化推荐算法尽可能要求实时完成推荐。这是⼤数据区别于传统数据挖掘的显著特征。 数据是在线的(Online):数据是永远在线的,是随时能调⽤和计算的,这是⼤数据...
Hbase 二级索引方案
浏览:159
5星 · 资源好评率100%
进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。 Solr 可以高亮显示搜索结果,通过索引复制来提高可用,性,提供一套强大 Data Schema 来定义字段,类型和设置文本分析,提供基于 ...
MapReduce_新型的分布式并行计算编程模型_李成华.pdf
浏览:66
MapReduce是Google提出的分布式并行计算编程模型,用于大规模数据的并行处理。Ma-pReduce模型受函数式编程语言的启发,将大规模数据处理作业拆分成若干个可独立运行的Map任务,分配到不同的机器上去执行,生成某种格式的中间文件,再由若干个Reduce任务合并这些中间文件获得最后的输出文件。用户在使用MapReduce模型进行大规模数据处理时,可以将主要精力放在如何编写Map和Redu
评论
收藏
内容反馈
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
限时特惠:¥9.90
19.90
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
结冰架构
粉丝: 803
资源:
28万+
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
霸王的大陆[简][V1.4].zip
扫描全能王 6.64.1.2405070000 VIP youre.apk
Torrent-Pro-6(1.8.7)-All-Mod-youarefinished.apk
c++采用Boost方式,搭建服务端、客户端通信
南京邮电大学离散数学实验
27b0a55aa36ed02987252e6e7e28f944.mov
main.cpp
雨声.m4a
日志耗时统计工具,统计各个锚点之间的耗时
166666666666666666666
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功