没有合适的资源?快使用搜索试试~ 我知道了~
web-search-engine:Java中的Web搜索引擎,使用术语频率-逆频率文档(TFIDF)
需积分: 12 0 下载量 160 浏览量
2021-05-05
16:35:18
上传
评论
收藏 282.04MB ZIP 举报
温馨提示
网页搜寻引擎 演示版 视频-https: 介绍 它是Java中的Web搜索引擎,它接受10000多个网站作为输入,对其进行索引,并根据查询返回前10页。 它具有诸如爬网程序,索引编制,解析,拼写检查和查询建议之类的功能。 这些概念用于开发此Web搜索引擎 倒排索引 TST(三元搜索Trie)用于存储索引文档 词频-反向文档频率,用于衡量一个单词相对于其他文档而言有多重要 搜寻器中的HashSet,用于检查是否在固定时间内对网址进行了爬网 HashMap保留文档ID和文档信息记录 Sorting(Collections.sort-mergesort)对排名页面进行排序 正则表达式将文档拆分为单词 汤 编辑距离以进行拼写检查。 怎么跑 在Eclipse中导入项目 在项目中包括外部库Jsoup 跑步
资源推荐
资源评论
资源评论
真好玩主人
- 粉丝: 17
- 资源: 4632
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功