没有合适的资源?快使用搜索试试~ 我知道了~
基于PSOFS和TSK模糊系统的不平衡心电数据分类算法.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 146 浏览量
2023-02-23
16:44:10
上传
评论
收藏 331KB DOCX 举报
温馨提示
试读
21页
基于PSOFS和TSK模糊系统的不平衡心电数据分类算法.docx
资源推荐
资源详情
资源评论
0 引言
在收集到的心电图数据集中,正常心电图的数量远远多于心律不齐以及心
肌梗死的心电图数量,这是典型的不平衡数据
[1]
。心电图波段繁多、信息繁杂,
而且心电图易受各种因素影响,例如过度紧张、发热、躁动等。医学研究者从
繁杂的心电图中建立预测规律或者预测模型是极其困难的。而机器学习善于从
繁杂数据中挖掘出对应的线性或非线性规律,这能为建立预测模型提供很大帮
助。其中,模糊神经网络(fuzzy neural network,FNN)是机 器学习中的一
个重要领域,其能以规则和模糊集的形式对知识进行表达,因此模糊神经网络
具备良好的可解释性。
模糊分类一般包括以下过程:一是模糊划分,将输入样本映射到模糊子空
间中;二是建立与子空间相对应的模糊规则;三是借由模糊规则对输入样本进
行分类判断。在训练模糊规则时,通常会使用模糊 C 均值(fuzzy C-means,
FCM)算法学习模糊规则的前件。研究表明,FCM 算法的集中效果与数据集
规模有关,随着数据集规模增大到一定程度,数据规模越增加,集中效果越差。
学者们提出了很多人工神经网络(artificial neural network,ANN)的经
典 学 习 算 法 , 例 如 反 向 传 播 ( back propagation, BP ) 算 法 、 极 限 学 习 机
(extreme learning machine,ELM)
[2]
、径向基函数(radial basis function,
RBF)网络
[3]
等。其中,模糊神经网络是由模糊系统和神经网络构成的网络。
然而随着时代的发展,现有的模糊分类器难以满足人们对性能的要求,有学者
提出使用集成方法提升模糊分类器的性能。
● Stacking 型集成方法:Stacking 型集成方法可以多级融合模糊分类器或
模糊规则。例如,参考文献[4]训练多个分类器并将其作为初级分类器,再集成
初级分类器得到最终集成器;参考文献[5]在模糊规则层面进行集成融合。这种
方法的优点是可以提高模糊分类器的分类精度,缺点是集成模糊分类器的初级
子分类器不具有可解释性,训练时间较长。
● Boosting 型集成方法:Boosting 型集成方法的核心在于通过训练得到多
个相似却不同的子分类器,典型方法有参考文献[6]介绍的基于 AdaBoost 的方
法,也有参考文献[7]介绍的直接通过修改参数得到不同子分类器的方法。这些
方法的缺点在于子分类器之间存在联系,一旦修改就必须重新训练所有子分类
器,并且模型的复杂度会变得更高。
● Bagging 型集成方法:Bagging 型集 成 方 法
[8]
通过随机放回抽样得到多
组子数据集,并用子数据集独立地训练子分类器。这种方法的缺点是其难以准
确 地 处 理 大 规 模 数 据 集 , 且 在 多 数 数 据 集 中 , Bagging 的 准 确 性 略 低 于
Boosting。
为了解决上述问题,本文提出基于粒子群优化特征选择(particle swarm
optimization feature selection , PSOFS ) 算 法 和 TSK ( Takagi-Sugeno-
Kang)的并行集成模糊神经网络(PE-PT-FN)。PE-PT-FN 的集成方法是对
Bagging 型集成方法的改进。PE-PT-FN 的贡献如下。
● PE-PT-FN 通过对不同标签集分别进行随机放回抽样后再合并获得子训
练集,确保子训练集中各类样本分布平衡,从而提升模型对不平衡数据的处理
能力。每个子训练集都是原始数据集中的一部分,能在充分保留子训练集可解
释性的前提下,降低子分类器之间的相关性。而且,独立且并行的集成模式也
确保了模型在集成层面的可解释性。
● PE-PT-FN 能控制子训练集的数量规模。训练前件可以提高 FCM 的聚类
性能,使得前件学习更加精确;训练后件能防止因数据集规模过大产生的过拟
合问题。
● PE-PT-FN 通过 PSOFS 算法从子训练集中获得特征子集,能减少冗余
数据对模型的干扰,从而有效地提升模型的精度。特征选择得到的特征子集还
能为医学研究者总结预测规律提供参考数据。
1 相关工作
1.1 TSK 模糊 系 统
本节简单介绍 TSK 模糊系统
[9,10,11]
的构成,对于经典的 TSK 模糊神经网络
(TSKFNN)而言,模糊规则表示如下:
其中,∧ 表示并且,R
k
表示第 k 条规则, is 表示属于, 表示输入向量,
表示第 i 个输入变量 x
i
对应的第 k 条规则所描述的模糊子集,K 表示模糊规则
的数量,是真值参数,y
k
是按照第 k 条规则得到的解,是 y
k
的函数表达形式。
而对于输入向量而言,就是 y
k
的加权和:
其中,w
k
是 y
k
的权值;是对应 模糊子集 A
k
的隶属函 数,可将 与所有
隶属函数的比值之和作为 y
k
的权值,第 k 条规则的隶属函数如下:
用式(3)中的 代替式(2)中的,可得:
隶属函数有很多种,如三角函数、梯型函数和高斯函数等。式(5)就是
高斯函数型的隶属函数。
其中, 表示中心点,即 TSK 模糊系统中的前件参数,可以通过 FCM 计
算模糊聚类中心获得;δ 表示带宽。FCM 在处理小规模数据集方面具有不错的
聚类效果。但随着数据集的规模增大,FCM 的聚类效果下降,时间成本增加。
传统的 TSK 模糊系统难以处理复杂的现实数据,如不平衡数据、大规模
数据等。随着社会的发展,人们对模型分类性能的要求逐步提升。为了解决上
述问题,本文提出一种基于 PSOFS 和 TSK 的并行集成模糊神经网络。该网
络能够很好地保留模糊子分类器的可解释性,同时提升对复杂数据的处理能力。
1.2 PSOFS
粒子群优化(particle swarm optimization,PSO)算法源于对昆虫、鸟群
和鱼群等相互合作的群体集聚行为的思考。这些群体中的成员会根据自己的经
验和周围同伴的经验改变自己的搜索策略。PSO 算法通过设计一种无质量的
粒子群来模拟自然界中的群体,粒子仅具有速度和位置两个属性,速度代表粒
子在空间中移动的快慢和方向,位置代表粒子在空间中的坐标。每个粒子都在
搜索空间中单独地搜索最优解,并将其记为自身最优位置。粒子群中的所有粒
子都会共享自身最优位置,在所有的自身最优位置中挑选出最好的位置作为粒
子群全局最优位置。随后,每个粒子都会根据当前自身最优位置和当前全局最
优位置来调整自己的速度和位置。
特征选择
[12,13,14]
是为了从数据集中选择出效果更好的特征子集。当前的特
征选择算法主要分为 3 种。
● 过滤法:过滤法基于特征的通用表现来选择特征。
● 包裹法:包裹法将结果性能作为特征子集的评价准则。
● 嵌入法:嵌入法将特征选择嵌入训练过程。
PSOFS 算法属于典型的包裹法,将结果性能作为特征子集的评价标准。
PSOFS 算法将数据集的特征空间作为搜索空间,其搜索最佳的特征子集与
PSO 算法在搜索空间中搜索最佳位置相对应。PSOFS 算法使用搜索到的当前
特征子集训练学习器,其通过结果性能评估特征子集与 PSO 算法评估位置相
对应。
2 并行集成模糊神经网络
2.1 并行集成模糊神经网络
并行集成模糊神经网络的模型架构如图 1 所示。DTR 和 DTE 分别表示训
练集和测试集,将 DTR 根据不同标签分成多个不同的标签集。 是 L 组独立的
子数据集。子分类器是相互独立的模糊系统,通过 FCM 求解前件参数,通过
RBF 求解后件参数。
训练阶段:为了解决各类标签样本数量不平衡的问题,综合考虑整体样本
数量之后,以 1 000 为基准从不同标签集中抽取样本。为了尽可能保留训练集
的原始特征,子训练集会根据目标标签集的样本量对抽取样本量进行调整,合
并 后 得 到 子 数 据 集 S
i
。 其 中 number_Lable_i 是 当 前 标 签 集 的 样 本 量 ,
min_number 是所有标签集中的最小样本量。每个 S
i
都会通过 PSOFS 算法搜
索得到对应的特征选择器。L 组特征子集对不同特征的选用次数表示不同特征
的重要程度。每个特征子集都独立地训练出对应的模糊子分类器 TSK-FN。在
训练 TSK-FN 时,通过 FCM 算法学习模糊规则的前件,通过 RBF 学习模糊规
则的后件。与传统的集成学习不同,所有 TSK-FN 之间都是独立的,可以并行
地训练模糊子分类器。这样的并行结构可以独立地对子分类器进行操作而不影
响整个集成分类器的效果,后期维护也更加简单。子分类器的实现方法属于神
经网络,在本质上属于 TSK 模糊系统,因此其既有强大的自学习能力,也有
可解释性。
图 1
剩余20页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3675
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于Javascript和微信小程序的Anna设计源码
- 基于Java的仿制品设计源码 - bilibili
- 基于Javascript的影视动画设计源码 - cad
- 基于Java和深度学习的瓦斯浓度预测系统后端设计源码 - 瓦斯浓度预测后端
- Screenshot_20240528_103010.jpg
- 基于Python的新能源承载力计算及界面设计源码 - HAINING-DG
- 基于Java的本科探索学习项目设计源码 - 本科探索
- 基于Javascript和Python的微商城项目设计源码 - MicroMall
- 基于Java的网上订餐系统设计源码 - online ordering system
- 基于Javascript的超级美眉网络资源管理应用模块设计源码
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功