当前搜索引擎主要问题
检索需求的表达不够准确
用户的检索需求往往是非常复杂而特殊的无法以几个关键词的简单逻辑组合
来表达用户的检索需求
检索结果不够简洁
信息检索的理想目标是提供用户精确的查询信息,但无论是传统文档信息检
索还是 检索都是基于文档颗粒度的,只提供和用户查询相关的一批文档
集合。
因此,文档检索系统返回的相关信息太多,用户很难快速准确地定位到所需
的信息,通常需要浪费很多时间在这些文档集合中查找自己所需要的信息。
例如,在 上输入几个关键字(例如“中国 首都”),它有可能返回成
千上万个网页(约有 项符合“中国 首都”的查询结果)。
缺乏语义处理技术的支撑
传统信息检索以关键词为基础的索引、匹配算法尽管简单易行,但毕竟停留
在语言的表层,而没有触及语义,因此检索效果差强人意,很难进一步提高