没有合适的资源?快使用搜索试试~ 我知道了~
有噪声标注情况下的中医舌色分类方法.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 45 浏览量
2023-02-23
20:10:00
上传
评论
收藏 378KB DOCX 举报
温馨提示
试读
16页
有噪声标注情况下的中医舌色分类方法.docx
资源推荐
资源详情
资源评论
1. 引言
舌诊是中医(Traditional Chinese Medicine, TCM)望诊中的核心内容。舌色作为舌象诊
察重要特征之一,在中医上一般分为淡红舌、红舌、暗红舌、紫舌等 4 类,其颜色的变化
反映了人体脏腑气血津液的虚实和邪正盛衰
[1]
。长期以来,舌诊主要是通过医生的目测观
察、经验来判断病证。但在临床实践中,舌象的诊察会受到光线、温度等外界客观因素以
及医生主观性的影响,进而影响后续的症候诊断及依证施方。利用计算机对中医舌象进行
定量化、客观化和标准化的处理与分析,已成为当前舌诊客观化研究中的一个基础性问
题。
中医舌诊客观化的研究起步于 20 世纪 80 年代初期,其中以中医舌质、苔质颜色自动
分析为代表的工作可以分为两个阶段:第 1 阶段是传统方法,普遍采用人工特征+浅层机
器学习的框架,对舌色、苔色等进行分析和处理;第 2 阶段是基于深度学习的方法,采用
端到端的框架,实现中医舌象的智能分析与处理。
在第 1 阶段的研究工作中,通常提取舌图像的人工特征,如颜色直方图、颜色集、结
构元素描述符
[2]
、颜色共生矩阵
[3]
、图像矩
[4,5]
等颜色特征,用于舌色分类。文献[6]提出了
一种多因素相关的块截断编码用于提取图像的颜色特征,并在图像分类中取得较好的结
果。文献[7]提出了一种 AdaBoost 级联分类框架,提高了舌质颜色分类的准确率。文献[8]
在 RGB 空间提取了舌图像的颜色特征,采用支持向量机作为分类器,实现了舌色分类。
文献[9]利用主色调直方图作为颜色特征,在多标记学习算法下对舌质与舌苔进行了分类。
文献[10]在先验模板和标准的色块作为辅助基础上,利用 K 近邻(K-Nearest Neighbor, KNN)
作为分类器进行分类。王爱民等人
[11]
采用 Fisher 比率作为色度空间选择的依据,实现了舌
色和苔色的自动分类。
这一阶段的研究工作普遍人工提取舌图像的颜色特征进行分类,由于颜色特征对于光
照变化特别敏感,因此这些方法的鲁棒性较差,分类准确性难以令人满意。
2012 年以来,深度学习在图像分类、自然语言处理等领域取得了巨大突破。在第 2 阶
段的研究工作中,研究者尝试将深度学习应用于中医舌诊研究中,利用深度学习强大的特
征学习和语义表达能力,从大量的样本数据中自动学习舌图像的特征,实现舌色的分类。
文献[12]采用改进后的 CaffeNet 网络结构对预处理后的舌图像进行分类。文献[13]结合图
像预处理和深度学习,在舌图像数据集中验证了自搭建的卷积神经网络(Convolutional
Neural Network, CNN)的分类性能。文献[14]为了减小在舌色、苔色分类时,两者之间的相
互干扰,将整张舌图像按照舌色、苔色分布的区域分离开来分别送入轻型 CNN 网络进行
分类。在图像分类任务中,不同特征的融合往往会取得更好的分类结果,文献[15,16]提出
了不同的视觉与文本特征融合的方法,并在各自的分类任务中取得了更优的性能。
研究结果表明,基于深度学习的方法可以获得远超过传统方法的性能,舌色分类精度
有了显著的提升。但是,目前基于深度学习的中医舌色分类方法还存在以下问题需要解
决:
(1)深度神经网络模型结构复杂,计算复杂度和存储需求会大大增加。同时,需要大量
的有标注样本对网络进行训练,才能获得理想的性能。而在实际应用中,由于有经验的医
生标注成本昂贵,数据采集困难,往往难以获得大规模、有标注的舌象样本。如何利用小
规模的数据集,有针对性地设计深度网络模型,提升舌色分类的准确性,还需要进行深入
的研究;
(2)受医生的知识水平、诊断经验的限制,也因为光线、环境等客观因素的影响,医生
的标注样本中经常会出现错误,标注的样本数据中不可避免地会存在一定的噪声,噪声样
本的存在会对分类网络模型的训练造成影响,导致舌色分类的鲁棒性和准确性难以令人满
意。针对有噪声标注样本情况下的分类问题,学者开展了深入的研究工作,取得了有意义
的研究进展。比如,文献[17]提出一种简单而有效的注意力特征混合(Attentive Feature
Mixup, AFM)策略,利用注意力机制降低噪声样本的权重,进而抑制噪声样本对分类模型
的影响。文献[18]提出了置信学习的思想,用于识别和过滤错误样本。在过滤错误样本
后,调整样本类别权重,重新训练网络。文献[19]提出了一种框架用来构建健壮的损失函
数,有效解决了损失函数对噪声样本的欠拟合问题。文献[20]提出了一种基于噪声分类器
预测的标签校正算法,提升了分类网络模型的性能。文献[21]构建了网络参数和标签联合
优化的框架,利用网络输出结果更新标签,提升分类性能。文献[22]通过构建一种自治愈
网络实现对噪声样本的抑制和噪声标注的修正,提高了分类的精度。文献[23]提出了一种
不一致的潜在真实伪标注框架 IPA2LT,该框架在一定程度上解决了人脸表情注释的不一
致性带来的问题,提升了表情分类的精度。
上述的研究结果表明,对有噪声的样本进行识别并加以清除,可以有效提升分类模型
的性能。但是目前,针对有噪样本下的舌色分类的研究工作很少,当前舌色分类的鲁棒性
和准确性难以令人满意,严重阻碍了舌诊客观化研究的进展。
为此,本文提出了一种有噪声标注情况下的中医舌色分类方法,目的是实现舌色的鲁
棒、准确分类。主要的创新点包括:(1)提出了一种基于 2 阶段的数据清洗方法,用于对噪
声标注样本进行识别并加以清除;(2)针对舌象样本数据规模小的问题,设计了一种带通道
注意力机制(Channel Attention,CA)
[24]
的轻型卷积神经网络,以实现舌色的准确分类;(3)
提出了一种带有噪声样本过滤机制的知识蒸馏策略,该策略中加入了由教师网络主导的噪
声样本过滤机制,进一步剔除噪声样本,同时利用教师网络指导轻型卷积神经网络的训
练,提升了分类模型的性能。在自建的中医舌色分类数据集上的实验结果表明,与现有的
分类网络模型相比,本文提出的方法能以较低的计算复杂度,显著提升分类性能,分类准
确率达到了 93.88%。
2. 有噪声标注情况下的中医舌色分类方法
本文提出的有噪声标注情况下的中医舌色分类方法整体框图如图 1 所示。下面介绍本
文提出的两阶段数据清洗方法、轻型 CNN 网络结构、带有噪声样本过滤机制的知识蒸馏
策略等几个关键部分的具体实现细节。
图 1 有噪声标注情况下的中医舌色分类方法整体框图
下载: 全尺寸图片 幻灯片
2.1 两阶段数据清洗方法
如上所述,由于舌色类别之间并没有一个严格的界限和医生标注者的主观性等因素的
影响,舌象数据集中存在一些带有噪声标注的样本,影响分类模型的训练。为此,本文提
出了一种基于 2 阶段的数据样本清洗方法,其处理流程如表 1 所示。在第 1 阶段,采用
ResNet18 筛选出数据中的噪声样本。其基本思想是利用 ResNet18 网络从大部分干净样本
中学习到规律,筛选出噪声样本。通过多次随机划分和迭代,实现对数据集的初筛。由于
在第 1 阶段筛选数据的过程中,训练集中有噪声样本的存在,分类模型有可能会误将干净
的样本筛选掉。因此,本文又设计了第 2 阶段,利用经过第 1 阶段清洗后的数据集微调
剩余15页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3675
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Screenshot_2024-05-28-11-40-58-177_com.tencent.mm.jpg
- 基于Dart的Flutter小提琴调音器APP设计源码 - violinhelper
- 基于JavaScript和CSS的随寻订购网页设计源码 - web-order
- 基于MATLAB的声纹识别系统设计源码 - VoiceprintRecognition
- 基于Java的微服务插件集合设计源码 - wsy-plugins
- 基于Vue和微信小程序的监理日志系统设计源码 - supervisionLog
- 基于Java和LCN分布式事务框架的设计源码 - tx-lcn
- 基于Java和JavaScript的茶叶评级管理系统设计源码 - tea
- IMG_5680.JPG
- IMG_0437.jpg
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功