没有合适的资源?快使用搜索试试~ 我知道了~
基于Javaweb的搜索引擎的实现报告模板.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 193 浏览量
2022-11-30
17:13:16
上传
评论
收藏 2.12MB DOCX 举报
温馨提示
试读
34页
基于Javaweb的搜索引擎的实现报告模板.docx基于Javaweb的搜索引擎的实现报告模板.docx
资源推荐
资源详情
资源评论
仁爱学院
长 实 习 设 计 说 明 书
题目: 基于 Java web 的搜索引擎的实现
系 别:
专业班级:
学 号:
学生姓名:
指导教师:
蒋辉
2021 年 11 月 20 日
目录
1.项目治理 ........................................................................................ 2
............................................................................................................ 4
............................................................................................................ 8
.......................................................................................................... 10
.......................................................................................................... 13
.......................................................................................................... 21
.......................................................................................................... 22
.......................................................................................................... 29
参考文献 .......................................................................................... 33
1 项目治理
该部分文档编写负责人
该部分文档复核人
最终版本
项目开发打算必需由粗到细给出,每项任务要落实到人且规定该
任务的起止日期和时刻;明确每一个时期提交文档的日期和时刻。保
证任务按时正常完成。
简单部署人员任务分派和时刻分派
确信组长胡杨实现 Heritrix 网络爬虫的页面摄取,Lucene 全文
搜索,成立索引,依照索引进行搜索,运用 tika 页面解析器进行 html
页面的解析,运用 mmseg4j 分词器进行中文分词,编写功能完整的搜
索函数,并用 junit 进行简单的测试。确信组员李文杰要紧工作是设
计及实现主界面和搜索结果界面的设计,成立单表数据库的成立,在
数据库中添加有关页面信息,设计和实现数据访问类,设计和实现数
据元素的实体类,设计搜索结果页面的信息反馈,和进行本项目的软
件测试工作。
9 月 20 日至 9 月 30 日,组长与组员商讨搜索引擎的成立原理,
去图书馆借阅相关书籍。
确信搜索引擎实现功能为学院官网新闻板块的全文搜索,运用
apache 公司的开源项目 Lucene 实现全文搜索的索引成立及对索引的
搜索功能,运用网络爬虫 Heritrix 对被搜索页面进行摄取,运用开
源 jar 包 tika 对已摄取的 html 页面进行解析,中文分词部份利用
sougou 中文分词器。
10 月 8 日至 10 月 15 日,配置 Heritrix_1.14 网络蜘蛛,进行
目标网页的摄取,进行主界面的初步设计,成立数据库,在 myeclipse
中配置 Lucene_3.5,对摄取的 html 页面进行索引的成立,并编写
junit 测试类进行时期性测试。
10 月 16 日至 10 月 23 日,对成立的索引编写搜索实现类,并调
试,初步设计搜索引擎的搜索结果显示页面。
10 月 24 日至 10 月 31 日,在项目中加入中文搜索分词器,在数
据库中加入被搜索的页面信息,编写数据访问类,编写页面实体的实
体类。
11 月 1 日至 11 月 7 日,在项目中加入 tika 页面信息提取器,
实现完整的搜索功能,将搜索结果在搜索结果页面显示出来。
11 月 8 日至 11 月 15 日,最后完善项目,在搜索页面中加入结
果条数显示,在新页面中打开结果页面的链接,增加结果分页,每页
6 条结果。
11 月 16 日至 11 月 20 日,撰写本报告,撰写演示文稿。
2.需求分析
该部分文档编写负责人
该部分文档复核人
最终版本
项目的功能需求分析
本项目实现功能:
1.对学院官网新闻板块进行分析,成立索引。
2.在主页面输入要搜索的关键字,点击“搜索一下”按钮,稍等,
会自动跳转到搜索结果页面。
3.在结果页面,点击 tjrac 搜索,能回到主页面,在后面的文本
框中再次输入搜索关键字,点击“搜索一下”按钮,能从头进行搜索。
4.搜索结果显示页面中,能显示搜索结果的条数,并带有分页功
能,每页显示 6 条结果,点击“下一页”,“上一页”进行跳转,也能
够输入页面序号进行直接跳转。
5.结果页面显示搜索的结果的题目,题目同时又是超链接,点击
能够在新的页面中打开对应的网页,还会显示结果的中文摘要,对应
网址等。
剩余33页未读,继续阅读
资源评论
G11176593
- 粉丝: 6696
- 资源: 3万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功