人体行为识别是计算机视觉和模式识别领域的重要研究方向,它致力于开发能够理解人类行为的智能系统。在可穿戴技术飞速发展的当下,如何利用可穿戴传感器实现对人类行为的精确识别,已经成为一个热门课题。
传统的HAR(Human Activity Recognition,人体行为识别)方法大多采用启发式方法得到的工程特征来解决问题。这些特征通常是静态的,忽略了传感器数据的时间序列特性,导致无法实现连续的行为识别。此外,使用传统的BP(Back Propagation,反向传播)神经网络进行训练时,可能会出现过拟合,即在训练数据上拟合得过于精确,而不能泛化到未见过的数据上,导致得到的最优解并非全局最优。
为解决上述问题,研究者何杰等提出了一个基于深度学习的混合结构,该结构包括卷积操作、长短期记忆(LSTM)循环单元和极端学习机(ELM)分类器。这种方法不需要专家知识提取特征,可以动态建模特征的时间信息,更适用于特征分类,并且可以大幅缩短测试时间。这种方法的优势使其在与其他HAR算法相比时,具有更高的性能和效率。
具体来说,卷积神经网络(CNN)通过其卷积操作可以自动从原始数据中学习到有用的特征,而不需要人工设计。这在数据挖掘中显得尤为重要,因为手工设计的特征往往不能很好地适应复杂多变的真实世界数据。LSTM单元是循环神经网络(RNN)的一种特殊类型,它能够处理和预测序列数据中的重要事件,并拥有处理长期依赖信息的能力,对于理解时间序列数据中的动态特征特别有效。而ELM是一种单层前馈神经网络,它通过随机选择隐藏节点的权重和偏置来训练,这使得ELM相较于传统神经网络具有更快的学习速度和较好的泛化能力。
该研究使用了公开的数据集OPPORTUNITY作为实验材料进行评估,该数据集在国际性的行为识别挑战赛中使用。实验结果表明,提出的混合深度学习框架的性能超过非循环网络6%,比之前报告的最好的方法好8%。在效率上,与使用BP算法的神经网络相比,测试时间缩短了38%。这一系列的实验结果证实了该框架在HAR问题上的有效性。
通过这篇论文,我们了解到在人体行为识别领域,深度学习技术尤其是CNN、LSTM和ELM相结合的深度神经网络,能够有效地从连续数据中提取时间动态特征,并对这些特征进行分类,进一步缩短了测试时间。这为后续研究者在可穿戴传感器数据的人体行为识别领域提供了新的思路和方法,也为实际应用的开发和优化打下了理论基础。随着深度学习技术的不断进步和优化,未来基于可穿戴设备的人体行为识别技术将更加智能和实用,将广泛应用于健康监测、智能家居、安全监控等诸多领域。