IR-model基础知识


-
IR-model.包括概率模型 向量空间模型等的基础知识 看完很有启发!
什么是模型? ■模型是采用数学工具,对现实世界某种事物或 某种运动的抽象描述 ■面对相同的输入,模型的输出应能够无限地逼 近现实世界的输出 ■举例:天气的预测模型 模型和实现的区别 个模型可以用多种方法实现 例如:布尔模型可以用倒排文档 现,也可以用实现 信息检索模型 四元组 文档集的机内表示 用户需求的机内表示 文档表示、查询表示和它们之间的关系的模型框 架 给 和 评分 ■信息检索模型决定于: 从什么样的视角去看待查询式和文档 基于什么样的理论去看待查询式和文档的关系 如何计算查询式和文档之间的相似度 模型分类 集合论 模糊集 扩展的布尔模型 信息检索模型 布尔 代数 向量空间 扩展的向量空间 概率 隐性语义索弓 知 神经网终 人工智能 概率 语言模型 基于本体论的模型 推理网络 信念网络 布尔模型 布尔模型 文档表示 一个文档被表示为关键词的集合 查询式表示 查询式 被表示为关键词的布尔组合,用与或非连接 起来,并用括弧指示优先次序 匹配 个文档当且仅当它能够满足布尔查询式时,才将其检索出 来 不同的系统可以使用 不同的去除停用词 策略和 策略 ■索引中不同类型的辅助信息 ■不同的实现方法 强调 到目前为止,布尔模型是最常用的检索模型 因为: 由于査询简单,因此容易理解 ■通过使用复杂的布尔表达式,可以很方便地控制査 询结果 相当有效的实现方法 相当于识别包含了一个某个特定的文档 经过某种训练的用户可以容易地写出布尔查询 式 布尔模型可以通过扩展来包含排序的功能,即 扩展的布尔模型 问题 布尔模型被认为是功能最弱的方式,其主要问题在于不支持部分 匹配,而完全匹配会导致太多或者太少的结果文档被返叫 非常刚性与意咪着全部或意味着任何一个 如果我想要个词屮个词同时出现的文档,怎么表示? 不可能企望用户白己规定值 系统可以从开始,然后逐渐减少,但很麻烦 很难表小用户复杂的需求 很难控制被检索的文档数量 原则上讲,所冇被匹配的文档都将被返回 很难对输出进行排序 不考虑索引词的权重,所有文档都以相同的方式和查询相匹配 很难进行自动的相关反馈 如果一篇文档被用户确认为相关或者不相关,怎样相应地修改査询 式呢? 向量空间模型

2.20MB
IR_计算模型
2015-11-19IR_计算模型,IR_计算模型包括vsm,概率模型等的相关基础知识
1015KB
IR公司元器件SPICE模型
2012-08-30用于PSPICE仿真的IR公司所有的元器件SPICE模型
604KB
现代信息检索-IR模型(
2008-10-27现代信息检索第3章-IR模型(20061026修正).rar现代信息检索第3章-IR模型(20061026修正).rar
8小时Python零基础轻松入门
2020-05-20
68B
JAVA上百实例源码以及开源项目
2016-01-03百度云盘分享 简介 笔者当初为了学习JAVA,收集了很多经典源码,源码难易程度分为初级、中级、高级等,详情看源码列表,需要的可以直接下载! 这些源码反映了那时那景笔者对未来的盲目,对代码的热情、执着,
Python数据殿堂:数据分析与数据可视化
2020-01-02【入门基础+轻实战演示】【讲授方式轻松幽默、有趣不枯燥、案例与实操结合,与相关课程差异化】利用python进行数据处理、 分析,并结合大量具体的例子,对每个知识进行实战讲解,本课程通过大量练习和案例对各个知识点技能进行详细讲解。通过本 课程,学生将懂得pandas、numpy、matplotlib等数据分析工具;通过实战,学生将了解标准的数据分析流程,学会使用可视化的 方法展示数据及结果。
Java并发编程精讲
2019-09-28课程会讲解Java中并发相关技术的基础、原理和应用,从线程安全、线程(池), 锁实现和并发容器等高并发Java实现,去深入理解在并发编程中, 一些最容易被忽视的点,这些点也是我在多年编程经验中实际用到, 对于每个小节小课均会有实际的场景应用为你呈现。 同时这些也是面试过程中面试官考察的重点,掌握这些点,面试和工作时,做到心中有货,不慌不乱,能够胜任。
41.83MB
Python高级编程.pdf
2013-08-01《Python高级编程》通过大量的实例,介绍了Python语言的最佳实践和敏捷开发方法,并涉及整个软件生命周期的高级主题,诸如持续集成、版本控制系统、包的发行和分发、开发模式、文档编写等。《Pytho
4.4MB
敏捷开发V1.0.pptx
2020-07-01敏捷开发PPT 敏捷开发以用户的需求进化为核心,采用迭代、循序渐进的方法进行软件开发。在敏捷开发中,软件项目在构建初期被切分成多个子项目,各个子项目的成果都经过测试,具备可视、可集成和可运行使用的特征
SpringBoot实战教程:SpringBoot 博客项目开发及讲解
2020-05-14当前课程中博客项目的实战源码是我在 GitHub上开源项目 My-Blog,目前已有 1300 多个 star: 本课程是一个 Spring Boot 技术栈的实战类课程,课程共分为 3 大部分,前面两个部分为基础环境准备和相关概念介绍,第三个部分是 Spring Boot 个人博客项目功能的讲解,通过本课程的学习,不仅仅让你掌握基本的 Spring Boot 开发能力以及 Spring Boot 项目的大部分开发使用场景,同时帮你提前甄别和处理掉将要遇到的技术难点,认真学完这个课程后,你将会对 Spring Boot 有更加深入而全面的了解,同时你也会得到一个大家都在使用的博客系统源码,你可以根据自己的需求和想法进行改造,也可以直接使用它来作为自己的个人网站,这个课程一定会给你带来巨大的收获。 课程特色 课程内容紧贴 Spring Boot 技术栈,涵盖大部分 Spring Boot 使用场景。 开发教程详细完整、文档资源齐全、实验过程循序渐进简单明了。 实践项目页面美观且实用,交互效果完美。 包含从零搭建项目、以及完整的后台管理系统和博客展示系统两个系统的功能开发流程。 技术栈新颖且知识点丰富,学习后可以提升大家对于知识的理解和掌握,对于提升你的市场竞争力有一定的帮助。 实战项目预览
-
学院
工程制图 AutoCAD 2012 从二维到三维
工程制图 AutoCAD 2012 从二维到三维
-
下载
NVM_Express_Revision_1.3.pdf
NVM_Express_Revision_1.3.pdf
-
学院
基于Flink+Hudi构建企业亿级云上实时数据湖教程(PC、移动、小
基于Flink+Hudi构建企业亿级云上实时数据湖教程(PC、移动、小
-
博客
【CSDN软件工程师能力认证学习精选】用Python做数学计算之基础计算
【CSDN软件工程师能力认证学习精选】用Python做数学计算之基础计算
-
博客
vscode使用
vscode使用
-
博客
字节流、字符流(精细讲解)
字节流、字符流(精细讲解)
-
下载
135端口批量抓鸡工具
135端口批量抓鸡工具
-
学院
龙芯生态应用开发基础:C语言精要
龙芯生态应用开发基础:C语言精要
-
博客
达梦(DM)数据库常见问题详解
达梦(DM)数据库常见问题详解
-
下载
一份用户访谈操作指南
一份用户访谈操作指南
-
学院
用微服务spring cloud架构打造物联网云平台
用微服务spring cloud架构打造物联网云平台
-
下载
jpegsrc.v9d.tar.gz
jpegsrc.v9d.tar.gz
-
学院
2021 PHP租车系统 毕业设计 毕设源码 源代码使用教程
2021 PHP租车系统 毕业设计 毕设源码 源代码使用教程
-
学院
【Python-随到随学】 FLask第一周
【Python-随到随学】 FLask第一周
-
博客
憋不住了!这8 个 MySQL 陷阱,我不得不说一下...
憋不住了!这8 个 MySQL 陷阱,我不得不说一下...
-
下载
基于蒙特卡洛树搜索和策略价值网络(强化学习)的AI五子棋算法
基于蒙特卡洛树搜索和策略价值网络(强化学习)的AI五子棋算法
-
博客
Rancher管理k8s集群
Rancher管理k8s集群
-
学院
朱老师C++课程第3部分-3.6智能指针与STL查漏补缺
朱老师C++课程第3部分-3.6智能指针与STL查漏补缺
-
下载
运营的十八般武艺之思路篇:生命周期
运营的十八般武艺之思路篇:生命周期
-
下载
azure-storage-8.3.0.jar
azure-storage-8.3.0.jar
-
下载
HBase原理——要弄懂的sequenceId
HBase原理——要弄懂的sequenceId
-
下载
通过反复校正等离子体温度和光谱强度,对合金中主要和次要元素进行准确的定量CF-LIBS分析
通过反复校正等离子体温度和光谱强度,对合金中主要和次要元素进行准确的定量CF-LIBS分析
-
学院
【Python-随到随学】FLask第二周
【Python-随到随学】FLask第二周
-
博客
【Codeforces 1454 E】Number of Simple Paths,基环树,拓扑排序找环,dfs统计节点数
【Codeforces 1454 E】Number of Simple Paths,基环树,拓扑排序找环,dfs统计节点数
-
博客
Java高级面试题欢迎补充
Java高级面试题欢迎补充
-
博客
Elasticsearch 集群分布式模型与选主与脑裂问题
Elasticsearch 集群分布式模型与选主与脑裂问题
-
学院
响应式编程入门与实战(Reactor、WebFlux、R2DBC)
响应式编程入门与实战(Reactor、WebFlux、R2DBC)
-
学院
基于python的dango框架购物商城毕业设计毕设源代码使用教程
基于python的dango框架购物商城毕业设计毕设源代码使用教程
-
学院
C++MFC开发远程控制软件教程(VS2013)
C++MFC开发远程控制软件教程(VS2013)
-
学院
Mysql数据库面试直通车
Mysql数据库面试直通车