项目报告
基于 ASP 的搜索引擎的开发
随着互联网和宽带上网的普及,搜索引擎在中国异军突起,并日益渗透到人
们的日常生活中。在互联网普及之前,人们查阅资料首先想到的是拥有大量书籍
资料的图书馆,但是今天很多人都会选择一种更方便、快捷、全面、准确的查阅
方式—互联网。而帮助我们在整个互联网上快速地查找到目标信息的就是越来越
被重视的搜索引擎。本文通过分析国内外搜索引擎的发展现状,提出了一种利用
ASP 技术实现一个 B/S 体系结构的搜索引擎系统的方案,以期达到功能强大,操
作简单,通用性强,可以满足用户对信息搜索需要的搜索引擎系统。文中着重论
述了该系统的数据流程、功能实现与代码设计、后台管理等,并对相关技术作了
详细的介绍。报告在撰写过程中,力求将理论与系统应用相结合,对各种理论进
行阐述的同时配合系统从实际应用和操作技巧上加以说明,希望能够更充分地体
现这些知识与技术在系统中的应用与实现。
ASP;模糊查询;关键字;搜索引擎
Development of Search Engine Based on ASP
Abstract
With the popularization of the Internet and surfing the Net with broadband,
search engine likes a dark horse in China, and permeate through daily life day by day.
Before this, when people consult materials the first thought is the library that has a
large number of books .But now more and more people will choose Internet to search
for information .It’s more convenient, fast, comprehensive and accurate for searching
information. The search engine that helps us in the whole Internet to quickly identify
target information is played more and more attention to. In order to achieve the
formidable function, simply operating, stronger versatility and satisfy the users to the
information search need ,This paper gives a plan that realizes a systematic scheme of
search engine of B/S system structure through analyzing the current development of
search engine in domestic and international systematic with the technology of ASP.
This thesis mainly describes the data procedure of this system, functional realization
and code design, back-stage management, etc. emphatically in the article. It has
done more detailed introduction to relevant technology. The paper makes every effort
to use the theory and practice and combine together in the course of writing, the
cooperation system is explained from practical application and operation skill while
explaining various kinds of theories, hope to more fully reflect the knowledge and
application in this system of technology and realize.
Key words: ASP; fuzzy query; keyword; search engine
目 录
总页数:21 页
1 引言 ........................................................................1
1.1 课题背景 ................................................................1
1.2 搜索引擎的发展方向 ......................................................1
2 系统开发技术分析 ............................................................2
2.1 系统开发环境 ............................................................2
2.2 IIS 简介 ................................................................2
2.3 SQL SERVER 2000 简介 ....................................................2
2.4 ASP 简介 ................................................................2
3 概要设计 ....................................................................3
3.1 需求分析 ................................................................3
3.2 数据库设计 ..............................................................3
3.2.1 分类目录数据库表 ....................................................3
3.2.2 网站登录信息数据库 ..................................................4
3.2.3 管理员数据库表 ......................................................4
3.2.4 关键字记录数据库表 ..................................................5
3.3 系统设计结构图 ..........................................................5
4 系统前台模块设计 ............................................................5
4.1 网站搜索模块的实现 ......................................................5
4.1.1 功能描述 ...........................................................5
4.1.2 流程图 .............................................................6
4.1.3 界面设计 ...........................................................6
4.1.4 工作流程和代码设计 .................................................6
4.2 分类目录模块的实现......................................................7
4.2.1 功能描述 ...........................................................7
4.2.2 工作流程和代码设计 .................................................8
4.3 网站登录模块的实现 ......................................................9
4.3.1 功能描述 ...........................................................9
4.3.2 数据流程图 .........................................................9
4.3.3 工作流程 ..........................................................10
4.4 网站修改模块...........................................................11
4.4.1 功能描述 ..........................................................11
4.4.2 工作流程图 ........................................................11
4.4.3 界面设计 ..........................................................12
4.4.4 工作流程和代码设计 ................................................13
5 系统后台模块设计 ...........................................................13
5.1 网站管理模块的实现.....................................................13
5.1.1 功能描述 ..........................................................13
5.1.2 工作流程和代码设计 ................................................14
5.2 网站审核...............................................................15
5.3 分类管理模块...........................................................15
5.3.1 分类编辑 ..........................................................15
5.3.2 分类添加 ..........................................................16
5.3.3 分类删除 ..........................................................18
6 系统性能测试 ...............................................................18
6.1 系统测试环境...........................................................18
6.2 测试结果...............................................................18
结 论 ....................................................................19
参考文献 ....................................................................19
致 谢 ....................................................................20
声 明 ....................................................................21
第 1 页 共 21 页
1 引言
1.1 课题背景
随着因特网的迅猛发展、WEB 信息的增加,用户要在信息海洋里查找信息,
就像大海捞针一样,搜索引擎技术恰好解决了这一难题。目前,搜索引擎系统可
以分类三大类,分别是:目录式搜索引擎:以人工方式或半自动方式搜集信息,
由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架
中;机器人搜索引擎:由一个称为蜘蛛的机器人程序以某种策略自动地在互联网
中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查
询输入检索索引库,并将查询结果返回给用户;元搜索引擎:这类搜索引擎没有
自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进
行重复排除、重新排序等处理后,作为自己的结果返回给用户。
1.2 搜索引擎的发展方向
搜索引擎已成为一个新的研究、开发领域。因为它要用到信息检索、人工智
能、计算机网络、分布式处理、数据库、数据挖掘、数字图书馆、自然语言处理
等多领域的理论和技术,所以具有综合性和挑战性。又由于搜索引擎有大量的用
户,有很好的经济价值,所以引起了世界各国计算机科学界和信息产业界的高度
关注,目前的研究、开发十分活跃,并出现了很多值得注意的方向:
1.十分注意提高信息查询结果的精度,提高检索的有效性。用户在搜索引擎
上进行信息查询时,并不十分关注返回结果的多少,而是看结果是否和自己的需
求吻合。
2.基于智能代理的信息过滤和个性化服务。信息智能代理是另外一种利用互
联网信息的机制。它使用自动获得的领域模型(如 Web 知识、信息处理、与用户
兴趣相关的信息资源、领域组织结构)、用户模型(如用户背景、兴趣、行为、
风格)知识进行信息搜集、索引、过滤(包括兴趣过滤和不良信息过滤),并自
动地将用户感兴趣的、对用户有用的信息提交给用户。
3.采用分布式体系结构提高系统规模和性能。搜索引擎的实现可以采用集中
式体系结构和分布式体系结构,两种方法各有千秋。但当系统规模到达一定程度
(如网页数达到亿级)时,必然要采用某种分布式方法,以提高系统性能。
4.重视交叉语言检索的研究和开发。交叉语言信息检索是指用户用母语提交
查询,搜索引擎在多种语言的数据库中进行信息检索,返回能够回答用户问题的
所有语言的文档。如果再加上机器翻译,返回结果可以用母语显示。该技术目前
还处于初步研究阶段,主要的困难在于语言之间在表达方式和语义对应上的不确
定性。