基于交叉熵的安全Tri-training算法.docx资源-CSDN文库

版权申诉

48 浏览量 2022-06-10 08:14:39 上传评论收藏 1.24MB DOCX 举报

资源推荐

资源详情

资源评论

摘要半监督学习方法通过少量标记数据和大量未标记数据来提升学习

性能.Tri-training 是一种经典的基于分歧的半监督学习方法,但在学习

过程中可能产生标记噪声问题.为了减少 Tri-training 中的标记噪声对

未标记数据的预测偏差,学习到更好的半监督分类模型,用交叉熵代替错

误率以更好地反映模型预估结果和真实分布之间的差距,并结合凸优化

方法来达到降低标记噪声的目的,保证模型效果.在此基础上,分别提出

了一种基于交叉熵的 Tri-training 算法、一个安全的 Tri-training 算

法,以及一种基于交叉熵的安全 Tri-training 算法.在 UCI(University

of California Irvine)机器学习库等基准数据集上验证了所提方法的有

效性,并利用显著性检验从统计学的角度进一步验证了方法的性能.实验

结果表明,提出的半监督学习方法在分类性能方面优于传统的 Tri-

training 算法,其中基于交叉熵的安全 Tri-training 算法拥有更高的分

类性能和泛化能力.

关键词半监督学习；Tri-training 算法；交叉熵；凸优化；样本标记

传统的分类方法通常使用有标签的数据进行训练.然而,随着人们收

集数据能力的不断提升,获得大量的未标记数据样本相对容易,而获取已

标记数据样本通常却需要付出昂贵的人力、物力和财力.如何让学习器

利用少量的标记数据和大量的未标记数据来提升学习性能,是半监督学

习(semi-supervised learning, SSL)

[1-2]

所要解决的问题.目前常用的

半监督学习方法主要包括生成式方法

[3]

、半监督支持向量机(semi-

剩余25页未读，继续阅读

内容反馈

版权申诉

罗伯特之技术屋

粉丝: 3907
资源: 1万+

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip