• 基于机器学习的文本分类技术研究进展9pdf)

    摘 要: 文本自动分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速 的发展.提出了基于机器学习的文本分类技术所面临的互联网内容信息处理等复杂应用的挑战,从模型、算法和 评测等方面对其研究进展进行综述评论.认为非线性、数据集偏斜、标注瓶颈、多层分类、算法的扩展性及 Web 页分类等问题是目前文本分类研究的关键问题,并讨论了这些问题可能采取的方法.最后对研究的方向进 行了展望. 关键词: 自动文本分类;机器学习;降维;核方法;未标注集;偏斜数据集;分级分类;大规模文本分类;Web页分类

    4
    245
    420KB
    2009-06-10
    17
  • 基于基因表达式编程的进化模式定理.doc

    基于基因表达式编程的进化模式定理.doc

    0
    64
    309KB
    2009-06-10
    10
  • 基于基因表达式编程的递归函数挖掘.doc

    摘 要:为了解决传统基因表达式编程(GEP)无法发现多模函数的所有最优解的问题,将小生境概念引入到基因表达式编程中。分析了传统GEP算法在多模函数优化方面的不足,提出了小生境半径的自适应调整策略AMNR,提出了基于小生境基因表达式编程的多模函数优化算法NGEP-MFO。扩展了传统GEP的应用领域,实验表明,相对于传统GEP,NGEP-MFO能大幅提高发现所有最优解的成功率和判定最优解的准确度。 关键词:基因表达式编程;小生境;多模函数优化;多目标优化

    4
    136
    119KB
    2009-06-10
    10
  • 基于分布式学习的大规模网络入侵检测算法(pdf)摘 要: 计算机网络的高速发展,使处理器的速度明显低于骨干网的传输速度,这使得传统的入侵检测方法无法 应用于大规模网络的检测.目前,解决这一问题的有效办法是将海量数据分割成小块数据,由分布的处理节点并行理.这种分布式并行处理的难点是分割机制,为了不破坏数据的完整性,只有采用复杂的分割算法,这同时也使分割 模块成为检测系统新的瓶颈.为了克服这个问题,提出了分布式神经网络学习算法,并将其用于大规模网络入侵检 测.该算法的优点是,大数据集可被随机分割

    摘 要: 计算机网络的高速发展,使处理器的速度明显低于骨干网的传输速度,这使得传统的入侵检测方法无法 应用于大规模网络的检测.目前,解决这一问题的有效办法是将海量数据分割成小块数据,由分布的处理节点并行理.这种分布式并行处理的难点是分割机制,为了不破坏数据的完整性,只有采用复杂的分割算法,这同时也使分割 模块成为检测系统新的瓶颈.为了克服这个问题,提出了分布式神经网络学习算法,并将其用于大规模网络入侵检 测.该算法的优点是,大数据集可被随机分割后分发给独立的神经网络进行并行学习,在降低分割算法复杂度的同 时,保证学习结果的完整性.对该算法的测试实验首先采用基准测试数据 circle-in-the-square 测试了其学习能力,并 与ARTMAP(adaptive resonance theory supervised predictive mapping)和BP(back propagation)神经网络进行了比较; 然后采用标准的入侵检测测试数据集KDD’99 Data Set测试了其对大规模入侵的检测性能.通过与其他方法在相同 数据集上的测试结果的比较表明,分布式学习算法同样具有较高的检测效率和较低的误报率. 关键词: 入侵检测系统;网络行为;神经网络;分布式学习

    0
    132
    598KB
    2009-06-10
    14
  • 数据挖掘(PDF)数据挖掘作为一个新兴的多学科交叉应用领域,正在各行各业的决策支持活动

    数据挖掘作为一个新兴的多学科交叉应用领域,正在各行各业的决策支持活动 演着越来越重要的角色。本书将介绍数据挖掘()与数据库知识发现      )的基本知识,以及从大量有噪声、不完整、 至是不一致数据集合中,挖掘出有意义的模式知识所涉及的概念与技术方法。 本章将从数据管理技术演化角度,介绍数据挖掘的由来。以及数据挖掘的作用 意义。同时还将介绍数据挖掘系统的结构、数据挖掘所获得的知识种类,以及数 挖掘系统的分类。最后还简要介绍了当前数据挖掘领域尚存在的一些热点问题。

    4
    188
    3.56MB
    2009-06-10
    10
  • 随读语音朗读 10.4 完整版

    随读是一款语音朗读软件,与同类软件相比,随读有以下特点: 1:支持记事本、IE(内核)浏览器、MS Word这三种窗口的直接朗读、跟踪 2:支持剪切板监视朗读,拖放朗读 3:支持多种格式的文件:txt,doc,pdf,htm 4:支持大文本朗读(1MB以上文本) 5:具有录入朗读功能 6:具有换皮肤功能 7:具有插件功能,扩展性强 8:支持在线更新,更多精彩不断升级中....问题1:出现“由于应用程序配置不正确,应用程序未能启动。 重新安装应用程序可能会纠正这个问题。”提示是什么意思? 答:随读是基于vc2005开发的,需要vc2005运行库的支持, 您可以安装完整版的随读(在安装是选中"vc2005运行库")或到Microsoft网站上下载该安装包。 http://www.microsoft.com/downloads/details.aspx?displaylang=zh-cn&FamilyID=200b2fd9-ae1a-4a14-984d-389c36f85647 ========================================================================== 问题3:启动随读时出现“创建语音对象失败!”是怎么回事。 答:这是由于网上的部分语音朗读软件在卸载时把系统的语音组件也删掉了,您可以到随读网站上下载 "语音修复程序"来修复语音组件。 ========================================================================== 问题2:为什么不能朗读中文?为什么朗读效果这么差? 答:要朗读中文需要安装中文语音朗读引擎,随读网站提供了几个不错的语音引擎下载地址,体积虽然有点大, 不过效果确实不错,可以下载来试一下。

    2
    188
    3.49MB
    2009-01-12
    9
关注 私信
上传资源赚积分or赚钱