没有合适的资源?快使用搜索试试~ 我知道了~
2、调整现有的算法来适应多标签的分类 2、将训练样本按每个标签构造一个训练集,每个样本属于或不属于这个标签,对每个标签单独训练一个分类器,然后将多个分类器的结果
资源详情
资源评论
资源推荐
基于 WEKA 的数据挖掘算法学习(七)
1. 多标签分类算法
1.1 多标签分类介绍
传统的单标签分类:学习是从一个只属于一个标签 l 的样本集合中学习,其中每一个标
签属于一个互斥的标签集合 L |L| > 1。当|L|=2 时,这就是一个二分类问题,或文本和网页
数据的过滤(filtering)问题。当|L| > 2 时是多分类问题。
多标签分类:每个样本属于一个 L 样本集合的一个子集,多标签分类(multilabel
classification)分类器会给一个新的实例指定多个类别。分类模型有很广泛的实际应用,如:
一个文档可能同时属于多个分类;一个蛋白质可能具有多个功能。
并且,多个标签之间可能存在一定的依赖或约束关系,如蛋白质的所有功能组成的 gene
ontology。这个依赖或约束关系具有层次特性,经常可以描述为树或有向无环图结构,也称
为层次多标签分类。由于模型的输出具有层次结构,因此层次多标签分类又属于另外一个近
来非常活跃的研究领域:结构预测。层次多标签分类和结构预测都是崭新的、富有挑战性的
研究领域。在过去,多标签分类由文本分类和医学分析而产生和推动的。现在,现代的许多
应用对多标签分类方法需求持续增长,比如蛋白质分类,音乐归类,和语义场景分类。
1.2 相关/相似问题
一个同属于监督学习并和多标签分类很相关的问题就是排序问题(ranking)。排序任务
是对一个标签集排序,使得排在前面的标签与相应实例更相关。
在特定分类问题中,标签属于一个层次结构(hierarchical structure)。当数据集标签属
于一个层次结构的时候,我们这个任务为层次分类,如果一个样本与层次结构的多个节点相
关, 那么这个任务就被称为层次多标签分类。
多实例学习(multiple-instance learning)是监督学习的一个变种,用的比较少 ,就不
说了。
1.3 多标签分类方法
方法分为两种:1、将问题转化为传统的分类问题;2、调整现有的算法来适应多标签
的分类。
下面是两种方法的介绍:
问题转换法的主要思想是将多标签数据的学习转换为一个或者多个单标签数据的学习,
不受特定算法的限制。由于单标签数据挖掘现在已经有很多成熟的算法,例如,支持向量机、
贝叶斯分类器 、k近邻方法等, 因此通过将多标签问题转化为单标签问题就可继续沿用这
些传统的方法解决多标签问题。
算法适应法则是通过直接改进某种现存的单标签数据学习算法使之能够适应多标签数
据的处理。
章满莫
- 粉丝: 30
- 资源: 316
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0