IR-model基础知识

所需积分/C币:38 2015-11-19 09:47:43 573KB PDF
11
收藏 收藏
举报

IR-model.包括概率模型 向量空间模型等的基础知识 看完很有启发!
什么是模型? ■模型是采用数学工具,对现实世界某种事物或 某种运动的抽象描述 ■面对相同的输入,模型的输出应能够无限地逼 近现实世界的输出 ■举例:天气的预测模型 模型和实现的区别 个模型可以用多种方法实现 例如:布尔模型可以用倒排文档 现,也可以用实现 信息检索模型 四元组 文档集的机内表示 用户需求的机内表示 文档表示、查询表示和它们之间的关系的模型框 架 给 和 评分 ■信息检索模型决定于: 从什么样的视角去看待查询式和文档 基于什么样的理论去看待查询式和文档的关系 如何计算查询式和文档之间的相似度 模型分类 集合论 模糊集 扩展的布尔模型 信息检索模型 布尔 代数 向量空间 扩展的向量空间 概率 隐性语义索弓 知 神经网终 人工智能 概率 语言模型 基于本体论的模型 推理网络 信念网络 布尔模型 布尔模型 文档表示 一个文档被表示为关键词的集合 查询式表示 查询式 被表示为关键词的布尔组合,用与或非连接 起来,并用括弧指示优先次序 匹配 个文档当且仅当它能够满足布尔查询式时,才将其检索出 来 不同的系统可以使用 不同的去除停用词 策略和 策略 ■索引中不同类型的辅助信息 ■不同的实现方法 强调 到目前为止,布尔模型是最常用的检索模型 因为: 由于査询简单,因此容易理解 ■通过使用复杂的布尔表达式,可以很方便地控制査 询结果 相当有效的实现方法 相当于识别包含了一个某个特定的文档 经过某种训练的用户可以容易地写出布尔查询 式 布尔模型可以通过扩展来包含排序的功能,即 扩展的布尔模型 问题 布尔模型被认为是功能最弱的方式,其主要问题在于不支持部分 匹配,而完全匹配会导致太多或者太少的结果文档被返叫 非常刚性与意咪着全部或意味着任何一个 如果我想要个词屮个词同时出现的文档,怎么表示? 不可能企望用户白己规定值 系统可以从开始,然后逐渐减少,但很麻烦 很难表小用户复杂的需求 很难控制被检索的文档数量 原则上讲,所冇被匹配的文档都将被返回 很难对输出进行排序 不考虑索引词的权重,所有文档都以相同的方式和查询相匹配 很难进行自动的相关反馈 如果一篇文档被用户确认为相关或者不相关,怎样相应地修改査询 式呢? 向量空间模型

...展开详情
试读 81P IR-model基础知识
立即下载 低至0.43元/次 身份认证VIP会员低至7折
一个资源只可评论一次,评论内容不能少于5个字
上传资源赚积分or赚钱
    最新推荐
    IR-model基础知识 38积分/C币 立即下载
    1/81
    IR-model基础知识第1页
    IR-model基础知识第2页
    IR-model基础知识第3页
    IR-model基础知识第4页
    IR-model基础知识第5页
    IR-model基础知识第6页
    IR-model基础知识第7页
    IR-model基础知识第8页
    IR-model基础知识第9页
    IR-model基础知识第10页
    IR-model基础知识第11页
    IR-model基础知识第12页
    IR-model基础知识第13页
    IR-model基础知识第14页
    IR-model基础知识第15页
    IR-model基础知识第16页
    IR-model基础知识第17页

    试读结束, 可继续读3页

    38积分/C币 立即下载 >