有噪声标注情况下的中医舌色分类方法.docx资源-CSDN文库

版权申诉

45 浏览量 2023-02-23 20:10:00 上传评论收藏 378KB DOCX 举报

资源推荐

资源详情

资源评论

1. 引言

舌诊是中医(Traditional Chinese Medicine, TCM)望诊中的核心内容。舌色作为舌象诊

察重要特征之一，在中医上一般分为淡红舌、红舌、暗红舌、紫舌等 4 类，其颜色的变化

反映了人体脏腑气血津液的虚实和邪正盛衰

[1]

。长期以来，舌诊主要是通过医生的目测观

察、经验来判断病证。但在临床实践中，舌象的诊察会受到光线、温度等外界客观因素以

及医生主观性的影响，进而影响后续的症候诊断及依证施方。利用计算机对中医舌象进行

定量化、客观化和标准化的处理与分析，已成为当前舌诊客观化研究中的一个基础性问

题。

中医舌诊客观化的研究起步于 20 世纪 80 年代初期，其中以中医舌质、苔质颜色自动

分析为代表的工作可以分为两个阶段：第 1 阶段是传统方法，普遍采用人工特征+浅层机

器学习的框架，对舌色、苔色等进行分析和处理；第 2 阶段是基于深度学习的方法，采用

端到端的框架，实现中医舌象的智能分析与处理。

在第 1 阶段的研究工作中，通常提取舌图像的人工特征，如颜色直方图、颜色集、结

构元素描述符

[2]

、颜色共生矩阵

[3]

、图像矩

[4,5]

等颜色特征，用于舌色分类。文献[6]提出了

一种多因素相关的块截断编码用于提取图像的颜色特征，并在图像分类中取得较好的结

果。文献[7]提出了一种 AdaBoost 级联分类框架，提高了舌质颜色分类的准确率。文献[8]

在 RGB 空间提取了舌图像的颜色特征，采用支持向量机作为分类器，实现了舌色分类。

文献[9]利用主色调直方图作为颜色特征，在多标记学习算法下对舌质与舌苔进行了分类。

文献[10]在先验模板和标准的色块作为辅助基础上，利用 K 近邻(K-Nearest Neighbor, KNN)

作为分类器进行分类。王爱民等人

[11]

采用 Fisher 比率作为色度空间选择的依据，实现了舌

色和苔色的自动分类。

这一阶段的研究工作普遍人工提取舌图像的颜色特征进行分类，由于颜色特征对于光

照变化特别敏感，因此这些方法的鲁棒性较差，分类准确性难以令人满意。

2012 年以来，深度学习在图像分类、自然语言处理等领域取得了巨大突破。在第 2 阶

段的研究工作中，研究者尝试将深度学习应用于中医舌诊研究中，利用深度学习强大的特

征学习和语义表达能力，从大量的样本数据中自动学习舌图像的特征，实现舌色的分类。

文献[12]采用改进后的 CaffeNet 网络结构对预处理后的舌图像进行分类。文献[13]结合图

像预处理和深度学习，在舌图像数据集中验证了自搭建的卷积神经网络(Convolutional

Neural Network, CNN)的分类性能。文献[14]为了减小在舌色、苔色分类时，两者之间的相

互干扰，将整张舌图像按照舌色、苔色分布的区域分离开来分别送入轻型 CNN 网络进行

分类。在图像分类任务中，不同特征的融合往往会取得更好的分类结果，文献[15,16]提出

了不同的视觉与文本特征融合的方法，并在各自的分类任务中取得了更优的性能。

研究结果表明，基于深度学习的方法可以获得远超过传统方法的性能，舌色分类精度

有了显著的提升。但是，目前基于深度学习的中医舌色分类方法还存在以下问题需要解

决：

(1)深度神经网络模型结构复杂，计算复杂度和存储需求会大大增加。同时，需要大量

的有标注样本对网络进行训练，才能获得理想的性能。而在实际应用中，由于有经验的医

生标注成本昂贵，数据采集困难，往往难以获得大规模、有标注的舌象样本。如何利用小

规模的数据集，有针对性地设计深度网络模型，提升舌色分类的准确性，还需要进行深入

的研究；

(2)受医生的知识水平、诊断经验的限制，也因为光线、环境等客观因素的影响，医生

的标注样本中经常会出现错误，标注的样本数据中不可避免地会存在一定的噪声，噪声样

本的存在会对分类网络模型的训练造成影响，导致舌色分类的鲁棒性和准确性难以令人满

意。针对有噪声标注样本情况下的分类问题，学者开展了深入的研究工作，取得了有意义

的研究进展。比如，文献[17]提出一种简单而有效的注意力特征混合(Attentive Feature

Mixup, AFM)策略，利用注意力机制降低噪声样本的权重，进而抑制噪声样本对分类模型

的影响。文献[18]提出了置信学习的思想，用于识别和过滤错误样本。在过滤错误样本

后，调整样本类别权重，重新训练网络。文献[19]提出了一种框架用来构建健壮的损失函

数，有效解决了损失函数对噪声样本的欠拟合问题。文献[20]提出了一种基于噪声分类器

预测的标签校正算法，提升了分类网络模型的性能。文献[21]构建了网络参数和标签联合

优化的框架，利用网络输出结果更新标签，提升分类性能。文献[22]通过构建一种自治愈

网络实现对噪声样本的抑制和噪声标注的修正，提高了分类的精度。文献[23]提出了一种

不一致的潜在真实伪标注框架 IPA2LT，该框架在一定程度上解决了人脸表情注释的不一

致性带来的问题，提升了表情分类的精度。

上述的研究结果表明，对有噪声的样本进行识别并加以清除，可以有效提升分类模型

的性能。但是目前，针对有噪样本下的舌色分类的研究工作很少，当前舌色分类的鲁棒性

和准确性难以令人满意，严重阻碍了舌诊客观化研究的进展。

为此，本文提出了一种有噪声标注情况下的中医舌色分类方法，目的是实现舌色的鲁

棒、准确分类。主要的创新点包括：(1)提出了一种基于 2 阶段的数据清洗方法，用于对噪

剩余15页未读，继续阅读

内容反馈

版权申诉

罗伯特之技术屋

粉丝: 3675
资源: 1万+

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip