VIP会员
作者:CSDN
出版社:CSDN《程序员》
ISBN:1111111111117
VIP会员免费
(仅需0.8元/天)
¥ 40000.0
温馨提示: 价值40000元的1000本电子书,VIP会员随意看哦!
电子书推荐
-
信息检索导论(Christopher D. Manning Prabhakar Raghavan) 评分:
信息检索导论(Christopher D. Manning Prabhakar Raghavan等著 王斌 译) 最经典的搜索引擎入门书籍,由浅入深的带领读者进入搜索引擎世界。 目录: 第 1 章 布尔检索...............................................1 1.1 一个信息检索的例子..................................2 1.2 构建倒排索引的初体验..............................5 1.3 布尔查询的处理..........................................8 1.4 扩展的布尔检索模型及有序检索............11 1.5 参考文献及补充读物................................13 第 2 章 词项词典及倒排记录表...................14 2.1 文档分析及编码转换................................14 2.1.1 字符序列的生成............................14 2.1.2 文档单位的选择............................15 2.2 词项集合的确定........................................16 2.2.1 词条化............................................16 2.2.2 去除停用词....................................19 2.2.3 词项归一化....................................20 2.2.4 词干还原和词形归并....................23 2.3 基于跳表的倒排记录表快速合并算法....26 2.4 含位置信息的倒排记录表及短语查询....28 2.4.1 二元词索引....................................28 2.4.2 位置信息索引................................29 2.4.3 混合索引机制................................31 2.5 参考文献及补充读物................................32 第 3 章 词典及容错式检索............................34 3.1 词典搜索的数据结构................................34 3.2 通配符查询...............................................36 3.2.1 一般的通配符查询........................36 3.2.2 支持通配符查询的k-gram索引.....37 3.3 拼写校正...................................................39 3.3.1 拼写校正的实现............................39 3.3.2 拼写校正的方法............................40 3.3.3 编辑距离........................................40 3.3.4 拼写校正中的 k-gram索引............41 3.3.5 上下文敏感的拼写校正................42 3.4 基于发音的校正技术................................43 3.5 参考文献及补充读物................................44 第 4 章 索引构建.............................................46 4.1 硬件基础....................................................46 4.2 基于块的排序索引方法............................47 4.3 内存式单遍扫描索引构建方法................50 4.4 分布式索引构建方法................................51 4.5 动态索引构建方法....................................54 4.6 其他索引类型............................................56 4.7 参考文献及补充读物................................57 第 5 章 索引压缩.............................................59 5.1 信息检索中词项的统计特性....................59 5.1.1 Heaps定律:词项数目的估计......61 5.1.2 Zipf定律:对词项的分布建模.....62 5.2 词典压缩....................................................63 5.2.1 将词典看成单一字符串的 压缩方法........................................63 5.2.2 按块存储........................................64 5.3 倒排记录表的压缩....................................66 5.3.1 可变字节码....................................67 5.3.2 γ 编码.............................................68 5.4 参考文献及补充读物................................74 第 6 章 文档评分、词项权重计算及 向量空间模型....................................76 6.1 参数化索引及域索引................................76 6.1.1 域加权评分....................................78 6.1.2 权重学习........................................79 6.1.3 最优权重g的计算..........................80 6.2 词项频率及权重计算................................81 6.2.1 逆文档频率....................................81 6.2.2 tf-idf权重计算................................82 6.3 向量空间模型............................................83 6.3.1 内积................................................83 6.3.2 查询向量........................................85 6.3.3 向量相似度计算............................87 6.4 其他tf-idf权重计算方法...........................88 6.4.1 tf的亚线性尺度变换方法.............88 6.4.2 基于最大值的tf归一化.................88 6.4.3 文档权重和查询权重机制............89 6.4.4 文档长度的回转归一化................89 6.5 参考文献及补充读物................................92 第 7 章 一个完整搜索系统中的评分 计算......................................................93 7.1 快速评分及排序.......................................93 7.1.1 非精确返回前K篇文档的方法.....94 7.1.2 索引去除技术................................94 7.1.3 胜者表...........................................95 7.1.4 静态得分和排序............................95 7.1.5 影响度排序....................................96 7.1.6 簇剪枝方法....................................97 7.2 信息检索系统的组成................................98 7.2.1 层次型索引....................................98 7.2.2 查询词项的邻近性........................98 7.2.3 查询分析及文档评分函数的 设计...............................................99 7.2.4 搜索系统的组成..........................100 7.3 向量空间评分方法及各种查询操作 符的关联.................................................101 7.3.1 布尔检索......................................101 7.3.2 通配查询......................................102 7.3.3 短语查询......................................102 7.4 参考文献及补充读物..............................102 第 8 章 信息检索的评价..............................103 8.1 信息检索系统的评价..............................103 8.2 标准测试集.............................................104 8.3 无序检索结果集合的评价......................105 8.4 有序检索结果的评价方法......................108 8.5 相关性判定.............................................112 8.6 更广的视角看评价:系统质量及 用户效用.................................................115 8.6.1 系统相关问题..............................115 8.6.2 用户效用......................................115 8.6.3 对已有系统的改进......................116 8.7 结果片段.................................................116 8.8 参考文献及补充读物..............................118 第 9 章 相关反馈及查询扩展.....................120 9.1 相关反馈及伪相关反馈..........................120 9.1.1 Rocchio相关反馈算法.................122 9.1.2 基于概率的相关反馈方法..........125 9.1.3 相关反馈的作用时机..................125 9.1.4 Web上的相关反馈......................126 9.1.5 相关反馈策略的评价..................127 9.1.6 伪相关反馈..................................127 9.1.7 间接相关反馈..............................128 9.1.8 小结..............................................128 9.2 查询重构的全局方法..............................128 9.2.1 查询重构的词汇表工具..............128 9.2.2 查询扩展......................................129 9.2.3 同义词词典的自动构建..............130 9.3 参考文献及补充读物..............................131 第 10 章 相关反馈及查询扩展...................133 10.1 XML的基本概念...................................134 10.2 XML检索中的挑战性问题...................137 10.3 基于向量空间模型的XML检索...........140 10.4 XML检索的评价...................................144 10.5 XML检索:以文本为中心与以数据 为中心的对比.......................................146 10.6 参考文献及补充读物............................148 第 11 章 概率检索模型.................................150 11.1 概率论基础知识....................................150 11.2 概率排序原理........................................151 11.2.1 1/0风险的情况.........................151 11.2.2 基于检索代价的概率排序 原理..........................................152 11.3 二值独立模型........................................152 11.3.1 排序函数的推导......................153 11.3.2 理论上的概率估计方法..........155 11.3.3 实际中的概率估计方法..........156 11.3.4 基于概率的相关反馈方法......157 11.4 概率模型的相关评论及扩展................158 11.4.1 概率模型的评论......................158 11.4.2 词项之间的树型依赖..............159 11.4.3 Okapi BM25: 一个非二值的 模型..........................................160 11.4.4 IR中的贝叶斯网络 方法..........................................161 11.5 参考文献及补充读物............................162 第 12 章 基于语言建模的信息检索 模型..................................................163 12.1 语言模型...............................................163 12.1.1 有穷自动机和语言模型..........163 12.1.2 语言模型的种类......................165 12.1.3 词的多项式分布......................166 12.2 查询似然模型.......................................167 12.2.1 IR中的查询似然模型..............167 12.2.2 查询生成概率的估计..............167 12.2.3 Ponte和Croft进行的实验........169 12.3 语言建模的方法与其他检索方法 的比较...................................................171 12.4 扩展的LM方法......................................172 12.5 参考文献及补充读物............................173 第 13 章 文本分类及朴素贝叶斯方法......175 13.1 文本分类问题.......................................177 13.2 朴素贝叶斯文本分类............................178 13.3 贝努利模型...........................................182 13.4 NB的性质..............................................183 13.5 特征选择...............................................188 13.5.1 互信息.....................................188 13.5.2 2 χ 统计量................................191 13.5.3 基于频率的特征选择方法......192 13.5.4 多类问题的特征选择方法......193 13.5.5 不同特征选择方法的比较......193 13.6 文本分类的评价....................................194 13.7 参考文献及补充读物............................198 第 14 章 基于向量空间模型的文本 分类..................................................200 14.1 文档表示及向量空间中的关联度 计算.......................................................201 14.2 Rocchio分类方法..................................202 14.3 k近邻分类器..........................................205 14.4 线性及非线性分类器............................209 14.5 多类问题的分类....................................212 14.6 偏差—方差折衷准则..............................214 14.7 参考文献及补充读物............................219 第 15 章 支持向量机及文档机器学习 方法..................................................221 15.1 二类线性可分条件下的支持向量机....221 15.2 支持向量机的扩展................................226 15.2.1 软间隔分类..............................226 15.2.2 多类情况下的支持向量机......228 15.2.3 非线性支持向量机..................228 15.2.4 实验结果..................................230 15.3 有关文本文档分类的考虑....................231 15.3.1 分类器类型的选择..................231 15.3.2 分类器效果的提高..................233 15.4 ad hoc检索中的机器学习方法.............236 15.4.1 基于机器学习评分的简单 例子.........................................236 15.4.2 基于机器学习的检索结果 排序.........................................238 15.5 参考文献及补充读物............................239 第 16 章 扁平聚类.........................................241 16.1 信息检索中的聚类应用........................242 16.2 问题描述................................................244 16.3 聚类算法的评价....................................246 16.4 K-均值算法............................................248 16.5 基于模型的聚类....................................254 16.6 参考文献及补充读物............................258 第 17 章 层次聚类.........................................260 17.1 凝聚式层次聚类....................................260 17.2 单连接及全连接聚类算法....................263 17.3 组平均凝聚式聚类................................268 17.4 质心聚类................................................269 17.5 层次凝聚式聚类的最优性....................270 17.6 分裂式聚类............................................272 17.7 簇标签生成............................................273 17.8 实施中的注意事项................................274 17.9 参考文献及补充读物............................275 第 18 章 矩阵分解及隐性语义索引..........277 18.1 线性代数基础........................................277 18.2 词项—文档矩阵及SVD..........................280 18.3 低秩逼近................................................282 18.4 LSI.........................................................284 18.5 参考文献及补充读物............................287
上传时间:2013-04 大小:7.69MB
- 7.8MB
Introduction to Information Retrieval
2018-02-07Introduction to Information Retrieval is the first textbook with a coherent treat- ment of classical and web information retrieval, including web search and the related areas of text classification ...
- 6.10MB
IR信息检索
2014-10-09IR信息检索 人 民 邮 电 出 版 社 北 京 王 斌 译 Christopher D. Manning Prabhakar Raghavan
- 6.93MB
An introduction to information retrieval
2012-12-03Christopher D. Manning Prabhakar Raghavan Hinrich Schütze
- 6.41MB
信息检索导论 中文版-王斌译1
2022-08-04图 灵 计 算 机 科 学 丛 书信息检索导论人 民 邮 电 出 版 社北 京王 斌 译Christopher D. Manning[美][德]版 权 声 明I
- 10KB
NLP-THU:NLP课程材料和质量检查
2021-05-07信息检索导论。 Christopher D. Manning,Prabhakar Raghavan和HinrichSchütze。 剑桥大学出版社,2008年。 名词间的语义关系。 Vivi Nastase,Preslav Nakov,DiarmuidÓSéaghdha和Stan Szpakowicz。 Morgan&...
- 5.85MB
斯坦福大学Introduction to Information Retrieval
2009-10-14Introduction to Information Retrieval Christopher D. Manning Stanford University Prabhakar Raghavan Yahoo! Research
- 7.68MB
信息检索导论1
2022-08-04图 灵 计 算 机 科 学 丛 书信息检索导论人 民 邮 电 出 版 社北 京王 斌 译Christopher D. Manning[美][德]版 权 声 明I
- 7.44MB
信息检索导论中文版1
2022-08-03图 灵 计 算 机 科 学 丛 书信息检索导论人 民 邮 电 出 版 社北 京王 斌 译Christopher D. Manning[美][德]版 权 声 明I
- 5.81MB
introduction to information retrieval
2013-10-26information retrieval 最经典教材 Introduction to Information Retrieval By Christopher D. Manning Stanford University Prabhakar Raghavan Yahoo! Research Hinrich Schutze University of Stuttgart
- 1.39MB
Introduction to Information Retrieval Solution-Manual
2012-10-02信息检索导论,Christopher D. Manning等著,cmu stanford都在用该书作为IR入门书籍。本文档是该书的习题答案,英文版,pdf格式。
- 24.65MB
美河提供.Manning.Python与Tkinter编程.pdf
2010-01-11美河提供.Manning.Python与Tkinter编程,一本非常不错的PYTHON 资源
- 17.35MB
程序设计入门 Manning.Hello.World_.Mar.2009.rar
2010-01-05Manning.Hello.World_.Mar.2009.rar
- 9.53MB
[web开发javascript系列].Manning.jQuery.in.Action.Feb.2008.part2.rar
2009-04-08[web开发javascript系列].Manning.jQuery.in.Action.Feb.2008.part2.rar(需要part1)
- 11.87MB
[web开发javascript系列].Manning.jQuery.in.Action.Feb.2008.part1.rar
2009-04-08[web开发javascript系列].Manning.jQuery.in.Action.Feb.2008.part1.rar(需要下载part2)
- 6.45MB
Manning.Functional.Programming.in.Java.2017.1
2017-11-22Manning.Functional.Programming.in.Java.2017.1 Manning.Functional.Programming.in.Java.2017.1 Manning.Functional.Programming.in.Java.2017.1
- 27.3MB
Manning.TypeScript.Quickly.2020 学习笔记
2023-12-21Manning.TypeScript.Quickly.2020 学习笔记 Manning.TypeScript.Quickly.2020 学习笔记 Manning.TypeScript.Quickly.2020 学习笔记 Manning.TypeScript.Quickly.2020 学习笔记 Manning.TypeScript.Quickly.2020 学习...
- 14.55MB
Manning.Spring.in.Action.4th.Edition.2014.11.zip
2016-05-24Manning.Spring.in.Action.4th.Edition.2014.11.zip 压缩包包含: 1.Manning.Spring.in.Action.4th.Edition.2014.11.epub 2.Manning.Spring.in.Action.4th.Edition.2014.11.pdf Manning Spring in Action 4th ...
- 166KB
《Introduction to Information Retrieval》中爬虫课件
2009-08-16Christopher D. Manning 所著 《Introduction to Information Retrieval》中爬虫课件
- 1.62MB
python大作业 含爬虫、数据可视化、地图、报告、及源码(整和为一个文件)(2014-2020全国各地区原油加工量).rar
2021-12-03(含源码及报告)本程序分析了自2014年到2020年每年我国原油加工的产量,并且分析了2019年全国各地区原油加工量,含饼状图,柱状图,折线图,数据在地图上显示。运行本程序需要requests、bs4、csv、pandas、matplotlib、pyecharts库的支持,如果缺少某库请自行安装后再运行。文件含2个excel表,4个csv文件以及一个名字为render的html文件(需要用浏览器打开),直观的数据处理部分是图片以及html文件,数据处理的是excel文件。不懂可以扫文件中二维码在微信里面问。
- 192KB
仿真电路以及操作方法
2020-12-20用一片通用四运放芯片LM324组成电路,实现以下功能:用低频信号源产生ui1=0.1sin2πft(V),f=500Hz的正弦波信号,加至加法器的输入端,加法器的另输入端加入有自制振荡器产生的信号uo1。要求加法器的输出电压ui2=10 ui1+ uo1。ui2经选频滤波器滤除uo1频率分量,选出f信号为uo2,uo2为峰峰值等于9V的正弦信号。uo2信号经比较器后在1KΩ负载上得到峰峰值2V的输出电压uo3。用NI Multisim 打开即可,参数已调好。对应博客:https://blog.csdn.net/weixin_43723423/article/details/90761331
- 6.17MB
【纯干货啊】华为IPD流程管理(完整版).pptx
2020-06-01华为IPD产品研发流程完整版。非常的详细,很适合给新是的实习生做培训用!是我一直在用的流程管理,很适合学习与交流。
- 11.57MB
可编程语言标准IEC61131-3中文版.pdf
2022-01-09可编程语言标准IEC61131-3中文版
- 6KB
OFDM完整仿真过程与教程.zip
2019-10-04辛苦写了关于OFDM的详细仿真,从产生信息流到最终解调,包含星座图,误码率图。包括了相关技术的详细解释,(信道编码,扩频,导频,信道估计等)。注:本段程序不包括射频传输部分,即载波调制,基带调制为QPSK。具体的教程可以参考我的相关文章。
- 10.80MB
信号与系统——保研复习资料.pdf
2020-09-16本文档为本人保研复习过程中撰写的信号与系统复习文档,参考书籍为吴大正老师主编的信号与线性系统分析(第四版),全文共43页,包含以下内容: 一、信号与系统(绪论) 二、连续系统的时域分析 三、离散系统的时域分析 四、傅里叶变换和系统的频域分析 五、连续系统的s域分析 六、离散系统的z域分析 七、系统函数 八、少量经典面试题(保研)
- 9.94MB
Landsat_WRS2.zip
2021-04-02本资源为WRS2全球条带号分幅情况SHP文件。WRS,即Worldwide Reference System,是Landsat系列卫星全球影像标记符号系统,用以区分全球各区域对应的Landsat系列卫星影像编号;其用“Path”与“Row”两个数值确定影像的编号与位置。其中,Landsat 1、2、3卫星对应编号系统为WRS-1,Landsat 4、5、7、8卫星对应编号系统为WRS-2。WRS-2包括降轨Descending(白天星,也就是在当地时间的白天过境)与升轨Ascending(黑夜星,也就是在当地时间的黑夜过境)两种模式。
- 19.9MB
最全的Visio形状/图形库
2019-01-02从不同地方搜集整理出来的Viso图标,全部文件都是Visio图形库的标准格式:VSS格式,内含有51个文件,分别对应类别。内容比较全面,包括常用图表、服务器图、各种符号图表、工作流程形状、绘制图表形状、网络和外设图、网络位置及物理逻辑图、最常使用的图表、办公室设备图及办公室附属设施图等等。
- 580B
AxureRP9项目原型50套、案例20个、元件库1套.zip
2019-10-18AxureRP9项目原型50套、案例20个、元件库1套。非原创,其中一批比较好的案例值得参考,元件库直接可用,简洁美观。分享给需要的人。
- 281KB
北理工+成电+东南——通信/信号保研面试真题.pdf
2020-06-04本文档整理了本人在2019年推免过程中,面试老师问到的问题,本文具体包括以下三所院校:北京理工大学雷达技术研究所;电子科技大学泛在无线网络实验室、多维信息感知实验室、图像处理研究所;东南大学移动通信国家重点实验室。对于面试中涉及到的专业课问题,我在面试结束后查阅书籍并给出了个人解答,仅供参考。
- 7.59MB
数字信号处理——保研复习资料.pdf
2020-09-16本文档为数字信号处理(DSP)复习文档,参考书籍为高西全老师主编的《数字信号处理——原理、实现及应用》第二版,全文共33页,包含以下内容: 一、绪论 二、时域离散信号与系统 三、时域离散信号和系统的频域分析 四、离散傅里叶变换( DFT)及其快速算法( FFT) 五、模拟信号数字处理 六、数字滤波器 七、IIR数字滤波器( IIRDF)设计 八、FIR数字滤波器( FIRDF)设计 九、少量经典面试题(保研)
- 102KB
风电和储能并网Simulink模型
2022-01-17在MATLAB2017a中搭建了风电和储能并网Simulink模型,风机采用传统的双闭环矢量控制策略,电池储能系统采用的是PQ矢量控制策略,可以稳定的向电网传输功率,电压电流波形较好。