没有合适的资源?快使用搜索试试~ 我知道了~
Search-Engine:基于文本的信息检索搜索引擎
共2个文件
md:1个
pdf:1个
需积分: 10 2 下载量 191 浏览量
2021-07-02
14:24:45
上传
评论
收藏 1.42MB ZIP 举报
温馨提示
搜索引擎 在这个项目中,我们使用如下讨论的方法实现了基于文本的搜索引擎: 1.) 使用 Apache lucene 库索引了超过 25,000 个网页。 2.) 基于词频和逆文档频率的文本搜索。 3.) 实施向量空间模型(使用词频和逆文档频率权重)来对网页进行排名。 4.) 使用邻接矩阵的编码权限/集线器计算机制并返回前 N 个权限和前 N 个集线器。 5.) 在 Java 中设计了 PageRank 算法以返回前 N 个网页。 6.) 在 Java 中编程 K-means 聚类以生成相关网页的聚类。 7.) 从前“N”个网页中提取代码段和标题以将它们显示给用户,以便用户可以选择与其查询更相关的网页。 8.) 编码和应用标量聚类,以便用户在输入查询词时可以获得相关建议。 并且,在实现上述算法之后,我们使用不同算法的不同输入数据集分析了结果。 各种算法的分析请参考《基于文
资源推荐
资源详情
资源评论
收起资源包目录
Search-Engine-master.zip (2个子文件)
Search-Engine-master
README.md 1KB
Analysis of Algorithm in Text based Search Engine.pdf 1.59MB
共 2 条
- 1
资源评论
咔丫咔契
- 粉丝: 18
- 资源: 4544
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 农村信用社联合社计算机信息系统投产与变更管理办.docx
- 农村信用社联合社计算机信息系统数据管理办法.docx
- 利用SPSS作临床效度分析线上计算网站介绍-医学研究部统计谘.(医学PPT课件).ppt
- 利用Zabbix监控mysqldump定时备份数据库状态.docx
- 利用计算机解决问题的基本过程.doc
- 化工铁路通信工程总结.doc
- 北京大学网络教育软件工程作业.docx
- 医药公司(连锁店)计算机操作规程未新系统的自行按照旧制修改-新系统过制的编号加修模版.doc
- 医药公司(连锁店)计算机系统操作规程模版.doc
- 医药连锁门店计算机系统的操作和管理程序未新系统的自行按照旧制修改-新系统过制的编号加修模版.docx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功