【免费】weka学习报告81资源-CSDN文库

需积分: 0 18 浏览量 2022-08-08 20:49:52 上传评论收藏 83KB DOCX 举报

资源详情

资源评论

资源推荐

基于 WEKA 的数据挖掘算法学习（七）

1. 多标签分类算法

1.1 多标签分类介绍

传统的单标签分类：学习是从一个只属于一个标签 l 的样本集合中学习，其中每一个标

签属于一个互斥的标签集合 L |L| > 1。当|L|=2 时，这就是一个二分类问题，或文本和网页

数据的过滤（filtering）问题。当|L| > 2 时是多分类问题。

多标签分类：每个样本属于一个 L 样本集合的一个子集，多标签分类(multilabel

classification)分类器会给一个新的实例指定多个类别。分类模型有很广泛的实际应用，如：

一个文档可能同时属于多个分类；一个蛋白质可能具有多个功能。

并且，多个标签之间可能存在一定的依赖或约束关系，如蛋白质的所有功能组成的 gene

ontology。这个依赖或约束关系具有层次特性，经常可以描述为树或有向无环图结构，也称

为层次多标签分类。由于模型的输出具有层次结构，因此层次多标签分类又属于另外一个近

来非常活跃的研究领域：结构预测。层次多标签分类和结构预测都是崭新的、富有挑战性的

研究领域。在过去，多标签分类由文本分类和医学分析而产生和推动的。现在，现代的许多

应用对多标签分类方法需求持续增长，比如蛋白质分类，音乐归类，和语义场景分类。

1.2 相关/相似问题

一个同属于监督学习并和多标签分类很相关的问题就是排序问题（ranking）。排序任务

是对一个标签集排序，使得排在前面的标签与相应实例更相关。

在特定分类问题中，标签属于一个层次结构（hierarchical structure）。当数据集标签属

于一个层次结构的时候，我们这个任务为层次分类，如果一个样本与层次结构的多个节点相

关，那么这个任务就被称为层次多标签分类。

多实例学习（multiple-instance learning）是监督学习的一个变种，用的比较少，就不

说了。

1.3 多标签分类方法

方法分为两种：1、将问题转化为传统的分类问题；2、调整现有的算法来适应多标签

的分类。

下面是两种方法的介绍：

问题转换法的主要思想是将多标签数据的学习转换为一个或者多个单标签数据的学习，

不受特定算法的限制。由于单标签数据挖掘现在已经有很多成熟的算法，例如，支持向量机、

贝叶斯分类器、ｋ近邻方法等，因此通过将多标签问题转化为单标签问题就可继续沿用这

些传统的方法解决多标签问题。

算法适应法则是通过直接改进某种现存的单标签数据学习算法使之能够适应多标签数

据的处理。

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余5页未读，立即下载

评论0

内容反馈

章满莫

粉丝: 30
资源: 316

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip