本文介绍了一种针对无线传感器网络(WSN)的能量利用率提升的分布式数据挖掘算法。无线传感器网络主要用于实时监测类应用,例如战场监视、森林火灾实时监测、大型温室监控等。在这些应用中,传感器节点采集的环境指标数据通常具有较高的冗余性。因此,进行有效的数据挖掘以减少冗余数据和降低网络通信量,进而延长网络寿命,是无线传感器网络研究的一个重要方向。
分布式数据挖掘模型构建的核心思想是将传感器网络看作一个复杂的神经系统,其中单个传感器节点可以被视为神经元,簇头节点则是中间的神经元,整个网络相当于一个庞大的神经系统。分布式数据挖掘模型通过多层感知器神经网络与分簇路由结构的结合,利用神经元的功能函数对原始数据进行融合处理,以减少数据通信、节省能耗、延长网络寿命。
提出的基于粗糙集和BP神经网络相结合的分布式数据挖掘算法,首先采用粗糙集理论对节点内原始数据进行离散化和属性约简,以获得最简决策表。然后利用简化后的训练集训练BP神经网络,并将训练好的神经网络集成到每个传感器节点上,以此来实现对网络数据的分类知识挖掘。粗糙集理论用于简化信息空间和降低冗余信息,而神经网络则作为信息识别系统,可以弥补粗糙集在分类能力上的不足。
在无线传感器网络中实施分布式数据挖掘的过程中,具体步骤如下:
1) 对训练数据样本进行连续属性离散化处理;
2) 利用粗糙集理论进行数据约简,从约简后的决策表中抽取分类规则集;
3) 使用简化后的训练集构造神经网络,确定网络结构和训练参数,并进行训练以获得连接权值;
4) 将训练好的BP神经网络部署到传感器节点上,形成评价知识库;
5) 利用神经网络分类器和辨识器对新的数据样本进行输入验证,并对挖掘算法进行评估。
整个数据挖掘模型要求无线传感器网络采用如LEACH、GROUP等分簇路由协议,在整个网络范围内选举簇头节点,形成分簇结构。这样分布式数据挖掘模型就可以在簇头节点和簇成员节点间利用训练好的神经网络算法,协同完成对采集到的大批原始数据进行数据挖掘的任务。通过这种方式,网络传输的将是经过数据挖掘处理后的数据模型,而非原始的高维冗余数据,从而进一步减少网络通信量和能耗。
研究成果表明,该算法能够有效降低数据维数,消除冗余数据,并减少网络通信量,最终达到延长网络寿命的目的。文中还提到了算法实现过程中的连续属性离散化算法,以及对粗糙集和BP神经网络的结合使用,其中传统粗糙集的局限性在于仅能处理离散数据,不适合直接应用于动态数据或流数据的场景,如无线传感器网络。
此外,作者洪月华教授主要研究领域包括数据挖掘、人工智能、无线传感器网络,在该研究中运用了粗糙集、BP神经网络等技术,并通过仿真验证了算法的有效性。本研究还得到了广西自然科学基金项目以及广西自然科学青年项目的支持。