2010—2011 学年第一学期
《信息检索 》考试答案及评分标准
一、 填空题 (每空 0.5 分,共 10分)
1、小王在某个数据库中检索到了 50 篇文献,查准率和查全率分别为 40%、80%,则全部相关文献有 25
篇。
2、文件 ABC.001.TXT 的后缀名是 TXT ,文件类型是 文本文件 。
3、多数网页采用 HTML 编写,这里的 HTML 指的是: 超文本标识语言 。
4、在使用搜索引擎检索时, URL:ustc 可以查到 网址 中带有 ustc 的网页。
5、根据索引编制方式的不同,可以将搜索引擎分为 索引型搜索引擎 和 网络目录型搜索引擎 。
6、 按文献的相关度来划分,可以把文献分为 密切相关文献 、 相关文献 、 参考文献 。
7、检索工具具有两个方面的职能: 存储职能 、 检索职能 。
8、利用原始文献所附的参考文献,追踪查找参考文献的原文的检索方法称为 追溯法 ,又称为 引文
法 。
9、、已知一篇参考文献的著录为: ” Levitan, K. B. Information resource management. New Brunswick: Rutgers
UP,1986 ”,该作者的姓是: Levitan 。
10、检索语言可分为两大类: 分类语言 、 主题词语言 。
11、当检索关键词具有多个同义词和近义词时,容易造成 漏检 , 使得 查全率 较低。
12、查询关键词为短语 "DATA OUTPUT" ,可以用位置算符 (W) 改写为: DATA (W) OUTPUT 。
二、 单项选择 (每题 1 分,共 15 分)
1、一般来说,关键词出现在文献的不同字段表达的相关性不同,以表达的相关性从强到弱排序如下: 【C】
A. 关键词 >标题 >文摘 >正文
B. 关键词 >文摘 >正文 >标题
C. 标题 >关键词 >文摘 >正文
D. 正文 >文摘 >关键词 >标题
2、关于索引型搜索引擎的采集和索引机制,错误的说法是: 【 B】
A. 采用网页采集机器人 robot,循着超链接不停采集访问到的页面
B. 网页采集机器人可以采集到所有的页面
C. 自动提取网页中的关键词建立索引
D. 网页的更新有一定的周期,有时候存储的网页信息已经过时
3、搜索含有 "data bank" 的 PDF 文件,正确的检索式为: 【A】
A. "data bank"+filetype:pdf
B. data and bank and pdf
C. data+bank+pdf
D. data+bank+file:pdf
4、在下列哪种检索工具中可以得到历年的统计数据?【 C】
A. 字典