第5讲免疫机器学习..docx资源-CSDN文库

版权申诉

158 浏览量 2022-06-14 22:58:59 上传评论收藏 203KB DOCX 举报

资源推荐

资源详情

资源评论

第 5 讲免疫机器学习与数据挖掘

学习目的：了解基于免疫系统原理的机器学习思想与方法及其在数据挖掘中的应用

学习要点：克隆选择分类算法、免疫网络聚类算法、克隆选择特征选择等

内容概要：前面我们知道免疫系统是一个具有学习能力的智能系统。在人工智能领域，设计

具有学习、思考能力的机器一直是一个重要目标，也是终极目标。虽然这个目标还很遥远，

但在向这个目标努力过程中衍生出来的多种技术方法，为人们解决许多复杂的问题提供了很

好的方案。其中形成的典型的研究领域就是机器学习。机器学习的本意是使机器象人类一样

思考和学习，但目前的机器学习研究在计算机科学领域主要以算法研究为主，在 40 年代的

基于优化的机器学习理论发展到 50 年代-80 年代的基于符号的机器学习理论，逐步形成了

几种主要的机器学习方法，包括规则归纳、决策树、范例推理、贝叶斯网络、遗传算法、神

经网络、科学发现等，以及基于粗集的学习理论和基于统计的学习理论、序列学习理论、强

化学习理论等

[1]

，虽然其中多数方法和理论目前都是用于解决一些特定问题，所有这些方法

和理论都是向达到真正的机器学习和智能目标努力。

机器学习涉及数学、认知科学、心理学、计算机科学等多个学科，广泛用于软件工程、

优化、数据挖掘（或者知识发现）、机器人、模式识别等领域。其中不少方法都是受自然启

发的，如遗传算法和神经网络。如今，免疫系统的独特的学习能力也不断受到关注。基于免

疫系统发展的学习方法已经成为机器学习领域的研究主题。同免疫优化算法一样，基于免疫

学理论和免疫系统机制发展的学习算法是人工免疫系统的重要内容，也是计算智能的新内

容。进化计算、人工神经网络和人工免疫系统在学习方面表现出一些共性，但又有各自的特

点。免疫系统的适应、学习和记忆能力不仅适用于优化等领域，也适合于开发用于机器学习

的人工免疫系统，虽然我们目前有许多机器学习方法和理论，但没有一种是完善的和万能的，

目前只能是互补，所以才有了人工免疫机器学习方法的发展空间。

目前的人工免疫机器学习方法主要是在免疫网络、克隆选择等免疫学理论上发展而来

的，也有基于阴性选择机制的学习方法，但都没有系统的理论。本讲根据这几个方面，结合

各自具体的应用来阐述有关内容。

5.1 免疫无监督学习方法

目前，无监督学习主要指的是聚类方法。在人工免疫系统领域，早期的研究工作是

Hunt 和 Cooke 描述的人工免疫系统模型，这是一个免疫系统启发的进化学习系统。其目的

[2]

是研究对机器学习和解决问题有用的免疫系统关键特征，用于简单的模式识别和 DNA 序列

标记识别。

Timmis 等在人工免疫系统模型基础上，提出了人工免疫网络模型（ articial immune

network model，AINE），用于无监督学习，主要提出了 B 细胞刺激水平和网络亲合力阈

[3]

值（NAT）思想。在 AINE 的基础上，最成功的基于免疫网络理论的无监督学习算法是资源

受限人工免疫系统（RLAIS）

[4]

。这个算法不仅利用了免疫网络动力学，也结合了克隆选择

原理，算法中引入形态空间的概念。模型定义了人工识别球 ARB(Articial Recognition Ball)

来代表 B 细胞。ARB 基于刺激水平(stimulation level)对 B 细胞进行分配，而当 ARB 不再需

要 B 细胞时，该 ARB 将被去除，由此实现有效的群体控制。通过将相似的 ARB 集中在一

起。该模型在表达了被学习数据模式的稳定结构基础上，具有继续学习的能力。资源的竞争

给系统加入适当的进化压力，确保只有最适应的细胞生存，最终对这些生存下来的细胞进行

克隆变异，并通过一定可视化方法把提呈的抗原数据聚类反应和表示出来。该网络模型和算

法具有快速、稳定地进行数据聚类分析的能力。资源有限人工免疫网络 (RLAIS) 模型也存

在很多不足之处：在网络中，系统拥有最多 B 细胞数目是预先设定的，其资源有限是人为

定义的，不是通过系统自制的平衡；为了控制网络的规模，B 细胞限制在一个水平上，人工

识别球 ARB 必须被压缩，造成网络过早收敛，系统解的多样性受到了限制。

受这个工作启发，Knight 提出了一个多层学习系统，包括自由抗体层、B 细胞层、记忆

细胞层

[5]

。在该算法中，不需要预先将细胞植入系统，系统可以进化自己的数据表示。表

示的核心是实际的 B 细胞层，它产生自由抗体以及记忆细胞。最终，利用得到的冗余记忆细

胞层进行数据分析。这个工作的价值在于它研究了稳定的免疫记忆结构产生模式，可在其它

免疫启发的算法中应用。

文献[6]基于 AINE 提出了人工免疫网络算法 AIN。这个算法与 AINE 在许多方面都很相

似。算法从一组抗体开始建立网络，每个抗体都是 n 维实数向量，虽然作者认为 AIN 将 B 细胞

简化为一个抗体，但实际上没有改变。算法结构与 AINE 也一样。文献[7]中将人工免疫网络

用于电子商务客户数据聚类，得到比传统方法更好的结果。

按照文献[3]的工作，Mark Neal 研究将免疫网络原理用于连续数据学习

[8]

，设计了基于

免疫网络的连续学习算法-自稳定人工免疫系统（SSAIS），与 RLAIS 最大的改进这处在于

不再受网络资源有限的限制，每一个 ARB 可以自己控制各自的 i 规模大小，可产生亚稳定记

忆系统。

文献 [9]中， Hart 提出了 SDM(sparse distributed memories)与免疫记忆结合的自组织

（self-organized SDM，SOSDM，解决 AINE 的伸缩能力，以及处理动态数据的性能问题。

Bentley 和 Timmis 于 2004 提出分形免疫网络，细胞之间的相互作用产生在细胞因子过

[10]

程，分形细胞因子表示为传输 FRS 的一次克隆，由分形接受器（FRS 的一个克隆子孙）接受

信号和计算相关程度，如果相似度在设定的阀值内，传输 FRS 就要受到刺激，受到刺激的传

输 FRS 将以固定的概率进行克隆，将产生下一代子孙，并重新整合免疫网络中，免疫网络的

动力学控制与 SSAIS 模型相同。

在分析上述方法的缺点基础上，Nasraous 在免疫网络以及简化中引入模糊技术，主要的

工作是将模糊数学引入 RLAIS 模型，使人工识别球并不是影响网络内的所有其它个体，每

个 ARB 都有自己的作用域，并提出了模糊识别球的概念。所提出的算法具有更大伸缩性

[11]

。

该算法结合了其他聚类技术，对噪声数据具有鲁棒性，并且允许一定范围的动态估计，得到

的结果比 RLAIS 更好。算法应用于网络连接数据的用户轮廓挖掘、Web 页面数据挖掘以及

数据聚类

[12][13]

。但算法要求存储所处理全部数据集合和所有网络相互作用亲合力，这限制

了算法的性能，只能对付小规模数据集合聚类问题。

Nasraoui 等在 2003 年提出了 TECNO-STREAMS 模型，它是为了解决 WEB 数据挖

[14]

掘技术，引入了动态加权 B 细胞 (D-W-B-cell)概念，对模糊 AIS 做了进一步的改进。

AINE 及后续改进算法使这类免疫监督算法不断完善。实际上，基本围绕以下问题进行

改进和完善：

1.输入数据和网络如何表示；

2.网络模式构成和网络连接方式；

3.网络如何初始化；

4.如何评价刺激水平和如何评价对刺激水平有作用的初始化影响：抗原刺激，邻近刺激

和邻近抑制；

5.刺激水平如何影响网络发展；

6.如何决定是否克隆一个节点和如何决定克隆率；

7.群体控制；

8.终止条件；

9.节点如何变异。

10.如何解释最后的网络，区分训练阶段和检测阶段。

这些问题一直是在从免疫系统获得启发的努力中的问题。伸缩性、自组织能力、对噪声

的鲁棒性、对动态数据的连续学习能力是这类方法追求的一般特征。

与 RLAIS 同时，de Castro 研究了 aiNet

[15]

，aiNet 的主要功能就是用一个小规模的“内镜

像”记忆网络映射源输入数据集，从而达到将数据压缩的目的，同时从数据集合抽取相关信

息，比如数据固有聚类的空间分布。aiNet 内的网络细胞数据在网络初始化阶段与输入数据

在同维空间表示，没有实现维数简化。当代表训练数据的抗原输入时，网络中的抗体要对抗

原进行竞争识别，通过以抗原－抗体之间的亲合力为标准，竞争成功的抗体就会导致网络活

化，该抗体进行扩增和克隆选择；网络以抗体－抗体之间的亲合力为标准，清除多余的低亲

合力免疫细胞来抑制网络的规模。随着算法运行和网络进化，基于免疫网络亚动力学思想，

网络规模被有效控制，最终只用较少记忆细胞数据反应输入的大量抗原数据，免疫网络也能

记住以前遇到的情况。免疫网络思想在该算法中体现得更完全，也结合了克隆选择和亲合力

成熟的概念。结合统计和图论方法，在一些无监督学习问题上算法表现得很成功。目前为止，

仍然是该领域的标志性方法。在 AINE 和 aiNet 基础上发展的免疫学习方法都归于基于免疫网

络的模型。

基于 aiNet 改进的模型 aiNet 层次模型前者不仅可发现基因数据中的主类

[16]

，也可发现子

聚类。其他改进的 aiNet 则用于优化等问题

[17]

。

Wierzchon et al 将 AINE 和 aiNet 结合起来，强调自组织能力。后续仍有许多方法是 aiNet

[18]

和 RLAIS 方法基础上的改进或启发，或者将上述方法用于生物信息学

[16][19]

、数据挖掘

[20]

、

文本聚类

[21][22][23]

等方面。图 14.1 给出了以 Hunt 和 Cooke 的 JISYS 为基础的免疫无监督学习的

发展过程。

最初的人工免疫系统模型 JISYS

[2][59]

SOSDM

AIS 监督学习

[9]

Mulit-layer AIS

[5]

AIRS

D-W-B cell

[14]

图 5.1 主要的免疫无监督学习方法发展线索

上述人工免疫聚类方法都是基于数据压缩和信息约简原理。数据内映像是基于数据紧凑

剩余11页未读，继续阅读

评论收藏

内容反馈

版权申诉

春哥111

粉丝: 1w+
资源: 5万+

第5讲 免疫机器学习..docx

第5讲 免疫机器学习..pdf

机器学习在计算机免疫中的应用.pdf

人工智能-机器学习-基于免疫的智能优化算法理论及应用研究.pdf

人工智能-机器学习-免疫进化算法及其在多机器人协作中的应.pdf

机器学习.docx机器学习.docx

人工智能习题&答案-第7章-机器学习.docx

代码实例及详细资料带你入门Python数据挖掘与机器学习.docx

数据挖掘与机器学习.docx

人工智能-机器学习-胞内细菌性感染激活模式识别受体信号介导的宿主免疫应答机制.pdf

人工智能-机器学习-隧道软弱围岩大变形监控及免疫智能.pdf

人工智能-机器学习-隧道软弱围岩大变形监控及免疫智能反分析.pdf

增强容错多模态机器学习 的免疫启发算法_python_代码_下载

2020-2021学年人教版生物 复习练习 八年级下册8.1--传染病与免疫..docx

大数据下的机器学习.docx

七步精通Python机器学习.docx

机器学习综述.docx

机器学习报告.docx

机器学习习题.docx

加权基因共表达网络与机器学习算法确定宫颈癌中免疫浸润相关的基因签名与预后分析.pdf

机器学习C++基于免疫算法/遗传算法的连通图最短哈密顿回路求解

人工智能-机器学习-模式识别受体在中华绒螯蟹特异性先天免疫中的功能研究.pdf

演化博弈matlab源代码-PhyloD:一套机器学习工具，用于对病毒适应性进行建模以宿主免疫React

immuneML:immunoML是用于自适应免疫受体库数据的机器学习分析的平台

机器学习作业.docx

(完整版)第七章机器学习.docx

机器学习方法有哪些.docx.pdf

的机器学习面试题机器学习爱好者必看.docx

机器学习决策树的分裂到底是什么？这篇文章讲明白了.docx

最新资源

第5讲免疫机器学习..docx

第5讲免疫机器学习..pdf

增强容错多模态机器学习的免疫启发算法_python_代码_下载

2020-2021学年人教版生物复习练习八年级下册8.1--传染病与免疫..docx