标题所提及的“计算机网络毕业论文”可能涵盖了计算机网络领域的多个知识点,包括互联网的历史发展、信息过载问题、网络信息检索系统以及搜索引擎的技术进展。描述中提到的“天网”搜索引擎是中国在这一领域的一个重要成果。
1. **互联网历史**:1993年UIUC大学开发的Mosaic是最早的Web浏览器之一,随后Netscape Navigator和Internet Explorer的推出,极大地推动了Web的普及。这标志着互联网从早期的文本基础转向图形界面,促进了信息的快速传播。
2. **信息过载**:随着互联网的爆炸式增长,用户面临大量信息,难以找到所需内容,从而引发了信息过载的问题。为了解决这个问题,网络信息检索系统应运而生。
3. **网络信息检索系统**:1994年后,如Yahoo!这样的网络信息目录和Lycos、Excite、AltaVista、Infoseek、Hotbot等搜索引擎开始出现,它们通过索引和搜索功能帮助用户从海量信息中找到所需内容。
4. **搜索引擎技术**:搜索引擎逐渐成为人们获取网络信息的主要工具,约85%的用户依赖搜索引擎。尽管如此,即便是强大的Google,也存在收集网页的速度跟不上Web增长速度的问题。
5. **天网搜索引擎**:天网是中国在1997年推出的一款中英文搜索引擎,它是“九五”重点科技攻关项目的一部分,旨在提供快速、准确、全面的Web信息导航服务。天网在教育网内广受欢迎,并在之后的“天网”二期工程中,发展出分布式并行搜集系统和查询系统。
6. **分布式并行搜集系统**:天网二期的系统利用Linux和Solaris操作系统,采用基于散列的任务分发策略,实现高效网页搜集。每台服务器可启动多个搜集机器人,平均每天可获取大量网页。
7. **查询系统**:由LINUX系统组成的查询系统,能够处理大量并发查询,具有良好的响应时间和性能,能够支持每天百万次的查询需求。
8. **重复网页检测算法**:“天网”二期采用的近似镜像网页检测算法能有效去除重复网页,提高存储效率和检索质量。
9. **搜索引擎发展趋势**:随着互联网数据量的持续增长,对搜索引擎的需求也在不断提升,推动了搜索引擎技术的不断创新和完善。
这篇毕业论文可能会深入探讨这些关键点,包括互联网早期的发展、搜索引擎技术的演变,特别是天网搜索引擎的创新及其在处理信息过载问题上的贡献,以及未来搜索引擎面临的挑战和可能的发展方向。