• Web文本挖掘技术研究

    作为从浩瀚的Web信息资源中发现潜在的、有价值知识的一种有效技术, Web挖掘正悄然兴起, 倍受关注. 目前, Web挖掘的研究正处于发展阶段, 尚无统一的结论,需要国内外学者在理论上开展更多的讨论. 同时,Web挖掘系统的开发对其研究也将起到很大推进作用. 首先探讨了Web挖掘的有关理论, 从Web挖掘的定义、Web挖掘与Web信息检索的关系、Web挖掘任务的分类与功能等方面加以阐述. 然后重点分析了Web文本挖掘的方法, 包括: 文本的特征表示、文本分类与文本聚类. 在此基础上简单介绍了一个Web文本挖掘系统原型WebMiner. WebMiner 采用了多agent 体系结构, 将多维文本分析与文本挖掘这两种技术有机地结合起来, 以帮助用户快速、有效地挖掘Web上的HTML文档.

    0
    197
    247KB
    2012-04-05
    9
  • 基于特征码的网页去重算法研究

    本文探讨了数据挖掘和搜索引擎的理论框架,以去除内容重复的冗余网页为研究目标, 分析了搜索引擎工作原理, 讨论了现有的去重算法。给出了一种基于特征码的网页去重算法, 并采用二叉排序树实现了算法。实验证明算法有着较高的去重准确率、召回率, 达到了对算法的预期。

    0
    98
    196KB
    2012-04-05
    10
  • 认知无线电网络架构与协议体系

    :认知无线电网络具有动态、灵活、智能地使用频谱资源,提高频谱利用率的特 点,其网络结构和协议体系的设计是实现上述网络功能的关键。现有基于认知无线 电技术的网络架构主要有美国的CORVUS系统,基于IEEE 802.22的无线局域网 (WRAN)和支持多信道多接口的无线Mesh网络;协议体系有CORVUS协议体系,军用 的XG系统协议及WRAN协议等。认知无线电网络架构与协议体系

    4
    132
    220KB
    2009-11-28
    9
关注 私信
上传资源赚积分or赚钱