没有合适的资源?快使用搜索试试~ 我知道了~
信息检索导论中文版1
需积分: 0 4 下载量 119 浏览量
2022-08-03
15:13:49
上传
评论
收藏 7.44MB PDF 举报
温馨提示
试读
435页
图 灵 计 算 机 科 学 丛 书信息检索导论人 民 邮 电 出 版 社北 京王 斌 译Christopher D. Manning[美][德]版 权 声 明I
资源详情
资源评论
资源推荐
图 灵 计 算 机 科 学 丛 书
信息检索导论
人 民 邮 电 出 版 社
北
京
王 斌 译
Christopher D. Manning
Prabhakar Raghavan
著
[美]
Hinrich Schütze
[德]
版 权 声 明
Introduction to Information Retrieval (978-0-521-86571-5) by Christopher D. Manning,
Prabhakar Raghavan and Hinrich Schütze first published by Cambridge University Press 2008
All rights reserved.
This simplified Chinese edition for the People’s Republic of China is published by arrangement
with the Press Syndicate of the University of Cambridge, Cambridge, United Kingdom.
© Cambridge University Press & Posts & Telecom Press 2010
This book is in copyright. No reproduction of any part may take place without the written
permission of Cambridge University Press and Posts & Telecom Press.
This edition is for sale in the People’s Republic of China (excluding Hong Kong SAR, Macao
SAR and Taiwan Province) only.
此版本仅限在中华人民共和国境内(不包括香港、澳门特别行政区及台湾地区)销售。
图书在版编目(CIP)数据
内 容 提 要
本书是一本讲授信息检索的经典教材。全书共 21 章,前八章详述了信息检索的基础知
识,包括倒排索引、布尔检索及词项权重计算和评分算法等,后十三章介绍了一些高级话题,
如基于语言建模的信息检索模型、基于机器学习的排序方法和 Web 搜索技术等。另外,本
书还着重讨论了文本聚类技术这一信息检索中不可或缺的组成部分。全书语言流畅,由浅入
深,一气呵成。
本书适合作为高等院校相关专业高年级本科生和研究生的课程教材,也可供信息检索领
域的研究人员和专业人士参考。
图灵计算机科学丛书
信息检索导论
著 [美] Christopher D. Manning, Prabhakar Raghavan
[德] Hinrich
Schütze
译 王斌
责任编辑 杨海玲
执行编辑 罗词亮 陈潇
人民邮电出版社出版发行 北京市崇文区夕照寺街 14 号
邮编 100061 电子函件 315@ptpress.com.cn
网址 http://www.ptpress.com.cn
北京****印刷有限公司印刷
开本:
印张:
字数: 2010年*月第 1 版
印数:1-3 000 册 2010年**
著作权合同登记号 图字:01-2009-7281 号
ISBN 978-
———————————————————————————————————————
定价:**元
读者服务热线:(010)51095186 印装质量热线:(010)67129223
反盗版热线:(010)67171154
符号对照表
符 号 原 书 含 义
γ 90 γ编码
γ 237 γ(d)表示分类或者聚类函数:γ(d)是d所属的类或者簇
Γ 237 第13、14章中的有监督学习方法:Γ(D)是从训练集D上学到的分类函数γ
λ 370 特征值
(.)
μ
r
,dq
r
r
269 类质心(在Rocchio分类中)或簇质心(在K-均值和质心聚类中)
Φ 105
训练样本
σ 374 奇异值
Θ(.) 10
算法复杂度的紧上界
ω, ω
k
328 聚类结果中的一个簇
Ω 328
聚类结果或簇集合{ω
1
,…, ω
K
}
argmax
x
f(x) 164 使 函数f 取最大值的x的值
argmin
x
f(x) 164 使 函数f 取最小值的x的值
c, c
j
237 分类中的一个类别
cf
t
82 词项t的文档集频率(该词项在整个文档集中出现的总次数)
C 237
类别集合{c
1
,…,c
J
}
C 248 取值为类别集合C中元素的随机变量
C 369 词项
—
文档矩阵
d 4 文档集D中的第d篇文档的索引号
d 65 一篇文档
163
文档向量及查询向量
D 326 所有文档的集合{d
1
,…,d
N
}
D
c
269 类别c中的文档集
D 237
第13~15章中的已标记文档集{<d
1
,c
1
>,…,<d
N
,c
N
>},即训练集
df
t
108 词项t的文档频率(文档集中出现t的文档数目)
H 91 熵
H
M
93 第M个调和数
I(X;Y) 252 随机变量X和Y的互信息
idf
t
108 词项t的逆文档频率
J 237 类别数目
k 267 集合中排名前k的元素,如kNN中的前k个邻居、检索文档的前k个结果以及
词汇表V中选出的前k个特征
k 50 k个字符组成的序列
K 326 簇的个数
L
d
214 文档d的长度(以词条为单位计数)
L
a
242 测试文档或应用文档的长度(以词条为单位计数)
L
ave
64 文档的平均长度(以词条为单位计数)
2 符号对照表
(续)
符 号 原 书 含 义
M 4 词汇表大小(即|V|)
M
a
242 测试文档或应用文档的词汇量
M
ave
71 文档集中每篇文档的平均词汇量
M
d
218 文档d的模型
N 4 检索或训练文档集中的文档数目
N
c
240 类别c中的文档数目
N(ω) 275 事件ω发生的次数
O(.) 10 算法复杂度的界
O(.) 203 事件的优势率
P 142 正确率
P(.) 202 概率
P 425 转移概率矩阵
q 55 查询
R 143 召回率
s
i
53 字符串
s
i
103 域评分布尔值
sim(
d
1
,d
2
) 111 文档d
1
和d
2
的相似度
T 40 文档集中所有词条的数目
T
ct
240 词t在c类文档中的出现次数
t 4 词汇表V中第t个词项的索引号
t 56 词汇表中的一个词项
tf
t,d
107 词项t在文档d中的出现频率(即t在d中的出现次数)
U
t
246 表示词项t存在与否的随机变量,当t存在时,值为1,否则为0
V 190 文档中的所有词项{t
1
,…,t
M
}组成的词汇表(也称为词典lexicon)
()vd
r
()Vd
r
T
wx b=
rr
w
111
文档d经长度归一化后的文档向量
110
文档d未经长度归一化的文档向量
wf
t,d
115 词项t在文档d中的权重
w 103
权重,比如域的权重或者词项的权重
269
超平面方程:
r
是超平面的法向量,w
i
是 w
r
的第i个分量
x
r
204 基于词项表示的文档向量
x
r
=(x
1
,…,x
M
),更一般地说,为文档的特征表示
X 246 取值为词汇表V中元素的随机变量(比如,某个文档位置k上的词)
237 文本分类中的文档空间
|
A| 56 集合A的势:集合A中的元素个数
|
S| 570 方阵S的行列式
|
s
i
| 53 s
i
的长度(以字符计)
|
x
r
| 128 向量
x
r
的大小
|
x
y−
rr
| 121 向量
x
r
y
、
r
的欧氏距离,也即向量(
x
r
−
y
r
)的大小
剩余434页未读,继续阅读
莉雯Liwen
- 粉丝: 22
- 资源: 306
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- JavaScript《基于自动分析数据并给出营业建议的餐厅管理系统(接入AI) 》+源代码+项目说明及资料
- 355670834783295707ad04e-427f-4cde-9589-e578224a8459.zip
- 动态sql解析引擎,类似mybatis动态sql的功能
- EDA365-Skill-V2.5安装包,支持Allegro17.x版本
- C# 常用单词汇总,常用单词汇总
- 【ERP标准流程-标准流程-库内业务管理】(DOC 14页).doc
- Python《数据库期末作业-餐厅点单系统 》+源代码+设计资料
- 学生成绩管理系统(C++课程设计
- 双指针法判断链表有环-go语言实现
- MyBatis动态SQL是一种强大的特性,它允许我们在SQL语句中根据条件动态地添加或删除某些部分,从而实现更加灵活和高效的数据
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0