下载  >  开发技术  >  其它  > 论文研究-基于《知网》的中文DeepWeb模式匹配算法研究.pdf

论文研究-基于《知网》的中文DeepWeb模式匹配算法研究.pdf 评分:

随着数据库在Internet中的应用日益广泛,Deep Web集成(即Web数据库集成)成为当前信息领域的研究热点,模式匹配是Deep Web查询接口集成中的一个关键问题。目前大多数这方面的研究都是基于英文的,针对这种情况,探讨了中文Deep Web查询接口的模式匹配方法,并提出了一种基于《知网》、面向中文语义的模式匹配算法,并利用属性在查询接口上的相对位置信息解决语义冲突。手工收集查询表单对算法进行验证,实验表明该方法能使得接口之间属性匹配的正确率达到90 %以上。

...展开详情
2019-07-22 上传 大小:279KB
举报 收藏
分享
论文研究-基于演化版本的DeepWeb查询接口维护方法.pdf

针对现有Deep Web信息集成系统没有考虑查询接口动态性的特点,造成本地接口与网络接口查询能力不对等的问题,提出一种基于演化版本的Deep Web查询接口维护方法。该方法通过构建本地接口的版本化模型来刻画接口的增量变化,识别变动比较活跃的属性集合;然后采取试探性查询来构建最优查询语句,获取网络接口数据源的变动信息,演化出本地接口的下一个版本,实现对本地查询接口数据源的信息维护的迭代过程。实验结果表明,该方法降低了深网环境变化对Deep Web信息集成带来的影响,确保了Deep Web查询接口的准确率和查全率的稳定性。

立即下载
论文研究-基于启发式信息的DeepWeb结果模式获取方法.pdf

获取模式信息是深入研究Deep Web数据的必要步骤,针对Deep Web结果模式结构信息的丢失问题,提出了一种基于启发式信息的Deep Web结果模式获取方法。通过解析Deep Web结果页面数据,利用启发式信息为结果页面数据添加正确的属性名,进而得到对应Deep Web的结果模式,并对其进行规范化处理,解决不同数据源结果模式的结构不一致问题。实验验证该方法可以有效地获取Deep Web的结果模式信息。

立即下载
论文研究-基于关联挖掘和语义聚类的DeepWeb复杂匹配方法.pdf

为了提高Deep Web查询接口匹配的效率和准确率,在现有双重相关性挖掘方法(DCM)的基础上提出了一种用关联挖掘和语义聚类来匹配的方法。在关联挖掘成组属性时,引入一种基于互信息的属性相关度标准,并采用矩阵来实现以解决效率不高问题;在生成同义属性时,提出利用语义网来计算语义相似度,并对属性进行聚类,以生成同义属性。通过在四个领域200多个查询接口上实验,说明改进的方法在效率和准确率方面都比DCM方法有很大提高。

立即下载
基于条件概率图模型的DeepWeb数据抽取与集成研究

西安电子的博士论文,主要讲述了基于条件概率图模型的DeepWeb数据抽取与集成研究

立即下载
DeepWeb信息抽取研究

采用基于关键词查询和建立文档对象模型的方法对专利数据库进行抽取实验。通<br>过分析实验结果,验证抽取方法的准确性,指出不足之处和解决的途径,以期达到充分利用Deep Web 信息资源的目的。

立即下载
基于DeepWeb的信息采集系统.pdf

随着互联网技术的迅速发展,大量结构化的高质量信息被埋入网络,却无法被传统的搜索引擎检索到,进而难以 被挖掘利用。针对这一现象,提出了基于Deep Web 的信息采集系统,设计了基于Web 的查询方式,并结合数据挖掘的相 关技术,获取并挖掘深网信息资源,解决传统手工采集信息的弊端,提高系统的使用效率,避免人工搜集时间和费用上的 开销,降低成本,便于维护。并且正在云南省大型仪器协作共用网络平台的建设中尝试实现这个子系统的设计。

立即下载
DeepWeb信息抽取系统的研究与实现

DeepWeb信息抽取系统的研究与实现

立即下载
Deep Web查询接口的复杂模式匹配

Deep Web查询接口的复杂模式匹配 Deep web 综述

立即下载
DeepWeb 爬虫 设计 策略

DeepWeb爬虫爬行策略,爬虫获取深度 WEB 数据

立即下载
论文研究-基于最优查询的多领域deepWeb爬虫.pdf

Deep Web信息通过在网页搜索接口提交查询词获得。通用搜索引擎使用超链接爬取网页,无法索引deep Web数据。为解决此问题,介绍一种基于最优查询的deep Web爬虫,通过从聚类网页中生成最优查询,自动提交查询,最后索引查询结果。实验表明系统能自动、高效地完成多领域deep Web数据爬取。

立即下载
论文研究-基于决策树和链接相似的DeepWeb查询接口判定.pdf

针对现有Deep Web查询接口判定方法误判较多、无法有效区分搜索引擎类接口的不足,提出了基于决策树和链接相似的Deep Web查询接口判定方法。该方法利用信息增益率选取重要属性,并构建决策树对接口表单进行预判定,识别特征较为明显的接口;然后利用基于链接相似的判定方法对未识别出的接口进行二次判定,准确识别真正查询接口,排除搜索引擎类接口。结果表明,该方法能有效区分搜索引擎类接口,提高了分类的准确率和查全率。

立即下载
介绍概率图模型的各类相关论文

不确定供应链管理网络的概率图模型仿真研究,基于概率图模型技术的柱面全景图生成算法,基于概率图模型目标建模的视觉跟踪算法,基于条件概率图模型的DeepWeb数据抽取与集成研究.nh,适合分布计算环境不确定性处理的概率图模型若干问题研究.kdh,一种新的面向对象的概率图模型.pdf

立即下载
Deep web经典文献(英文+中文)

包括 接口集成 查询处理 响应处理 英文文献较多 纯属个人整理,与大家分享

立即下载
deep web网址集合

deep web网址集合

立即下载
论文研究-DeepWeb入口探测与分类方法研究.pdf

传统的使用语料库对入口标签字符串进行匹配的方法受限于语料库的完整性和匹配算法的灵活性。为突破这种局限,引入了基于表单元件统计特征的Deep Web入口探测方法和使用文本分类方法对其进行分类的双层分类模型,并提出了两种特征权重计算方法用于特征选取。在TEL-8 Query Interfaces数据集上,测试结果体现了双层分类模型的优越性和特征向量维归约的必要性。

立即下载
论文研究-面向DeepWeb数据自动抽取的模板生成方法.pdf

Deep Web结果页面大多由网站根据请求从后台数据库读取数据并动态填充到通用模板而生成的。研究如何从一系列同模板生成的页面中生成该模板,并利用模板自动抽取数据。给出了模板生成问题的形式化描述,提出了一种新颖的模板生成方法,利用生成的模板从实例网页中抽取数据。与现有方法相比,该方法适用于列表页面和详细页面两种类型网页。通过在多个领域站点上实验,说明新方法在不降低准确率的情况下能大大提高召回率。

立即下载
论文研究-DeepWeb集成系统中同类主题数据源选择方法.pdf

提出了一个同类主题的Deep Web 数据源选择方法,该方法通过数据源差异性分析可有效判断出新数据源的内容与集成系统中已有内容的重复度,进而利用查准率和查全率建立质量估计模型评估各数据源的质量,削弱了已有研究中因查准率低对质量评估产生的负面影响。在主流图书类网站上的实验结果表明,该方法能减少系统的负担,同时获取质量较高的同类主题的数据源。

立即下载
论文研究-面向Deep Web基于页面分块的信息抽取对象模型 .pdf

面向Deep Web基于页面分块的信息抽取对象模型,苗忠义,崔志明,deepweb的重要性已被公认,人们提出了很多信息抽取算法,开发了一些信息抽取系统,但多是基于记录、字段级别,至今鲜有页面级信息抽取��

立即下载
html+css+js制作的一个动态的新年贺卡

该代码是http://blog.csdn.net/qq_29656961/article/details/78155792博客里面的代码,代码里面有要用到的图片资源和音乐资源。

立即下载
qBittorrent插件集合(22个)

btetree.py cpasbien.py divxtotal.py ilcorsaronero.py kickass.py leetx.py limetorrents.py linuxtracker.py nyaa.py nyaapantsu.py nyaasi.py pantsu.py psychocydd.py rarbg.py rutor.py skytorrents.py sukebei.py sumotorrent.py tntvillage.py torrent9.py torrentfunk.py zooqle.py

立即下载