【英文题名】 Research and Implementation of Intellectualized Web Information Search Engine
【作者】 李建平;
【导师】 马瑞民;
【学位授予单位】 大庆石油学院;
【学科专业名称】 计算机应用技术
【学位年度】 2003
【论文级别】 硕士
【网络出版投稿人】 大庆石油学院
【网络出版投稿时间】 2003-06-06
【关键词】 网络机器人; 搜索引擎; 信息检索; 元搜索; 更新周期;
【英文关键词】 Web Robot; Search Engine; Retrieval Information; Meta Search; Update Cycle;
【中文摘要】 Internet上的信息庞杂且分散,搜索引擎系统越来越成为人们网上冲浪和获取信息的必要工具。搜索引擎,是指在Internet中主动搜索信息并能自动索引、提供查询服务的一类网站,这些网站通过网络搜索软件(又称为网络搜索机器人Robots)或网站登录等方式,将Internet上大量网站的页面收集到本地,经过加工处理而建成本地数据库,当用户输入关键字(Keyword)查询时,该网站会告诉用户包含该关键字信息的所有网址,并提供通向该网站的链接。 目前,Internet中已经存在着许多搜索引擎系统,但是在功能上和性能上它们都存在着一些缺陷,尤其是查全率和查准率。研究搜索引擎技术开发新的检索工具以帮助人们在网上方便地找到想要的准确信息是目前亟待解决的问题。 文中对搜索引擎理论和技术进行概述,对网页特点作了分析和研究,比较分析了已经存在的各种搜索引擎系统,并在此基础上实现了两种类型的搜索引擎系统:基于目录的搜索引擎系统和基于机器人的综合式搜索引擎系统,这两种类型的系统相互联系、相互补充形成了一套智能化Web信息搜索引擎系统。 ...
【英文摘要】 Information on the Internet is very huge and distributed, search engine has more and more become an absolutely necessary tool of Internet surfers. Search engine is an information retrieval Web site, which can use Web robots or Web site entry to collect documents, then analyzes and deals with this information, creates and maintains index database, gives a service of search to the user. When user input a keyword to query, this Web site can give all the documents' abstracts and links including this keyword. ...