【阅读报告-19S003037-于晟健1】 这篇阅读报告讨论的是代价敏感分类问题,这是机器学习领域的一个重要课题,特别是在关键应用中,如医疗诊断和垃圾邮件过滤。传统的分类算法通常追求最高的准确率,但代价敏感分类关注的是不同错误分类的后果可能大不相同。报告中提到了几种不同类型的代价: 1. 错误分类代价:这是由于模型错误地分类实例而产生的成本,不同类别的错误可能导致不同程度的损失。 2. 测试代价:在模型构建过程中,用于评估某些属性或特征的代价,例如决策树在选择分裂点时的计算成本。 3. 获取样本的代价:收集训练数据可能需要付出费用,更多的数据可能提升模型性能,但也增加了获取数据的成本。 4. 指导代价:为获得实例的正确类别标签所付出的代价,这在需要专家知识或人工审核的情况下尤其显著。 5. 副作用带来的代价:干预过程可能对结果产生负面影响,如改变系统状态导致的损失。 6. 人机交互代价:用户在调整算法参数或数据预处理时的时间和精力投入。 7. 干预代价:为了达到特定目标而对生产流程进行人为调整的成本。 8. 不稳定性代价:模型在不同数据集上表现不稳定,可能导致额外的调整和验证成本。 报告指出,代价敏感学习是一片广阔的研究领域,其复杂性源于代价的多样性和可能随时间变化的特点。文献中提到了一种基于分歧的主动学习框架,该框架扩展到代价敏感的多分类问题。主动学习是通过有选择地获取最有价值的未标记样本来增强模型的一种策略,减少了对大量标注数据的需求。在本文中,作者使用了平方损失 oracle 来搜索版本空间,与传统方法(如枚举或0/1损失分类)相比,这种方法可通过凸优化在多项式时间内实现,从而提高了效率。 除了分歧方法,还有其他主动学习策略,如插入式规则和类条件回归函数的估计。报告提到的工作与这些方法共享算法思路,但有两点显著不同:(1)算法在 oracle 环境下运行,仅通过最小化平方损失问题来访问函数类;(2)算法适用于广泛的代价敏感多分类问题,而不仅仅是二分类问题。 此外,线性表示和分布假设下的主动学习也在相关研究中被探讨,这表明在选择性抽样和模型简化方面也有进展。整体而言,这篇报告揭示了代价敏感分类在理论和实践中的复杂性,以及主动学习策略如何适应不同类型的代价,以提高模型的实用性和效率。
剩余12页未读,继续阅读
- 粉丝: 18
- 资源: 292
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- SQL语言详细教程:从基础到高级全面解析及实际应用
- 仓库管理系统源代码全套技术资料.zip
- 计算机二级考试详细试题整理及备考建议
- 全国大学生电子设计竞赛(电赛)历年试题及备考指南
- zigbee CC2530网关+4节点无线通讯实现温湿度、光敏、LED、继电器等传感节点数据的采集上传,网关通过ESP8266上传远程服务器及下发控制.zip
- 云餐厅APP项目源代码全套技术资料.zip
- vscode 翻译插件开发,选中要翻译的单词,使用快捷键Ctrl+Shift+T查看翻译
- mrdoc-alpine0.9.2
- ACMNOICSP比赛经验分享:从知识储备到团队协作的全面指南
- 云餐厅项目源代码全套技术资料.zip
- 基于STM32的数字闹钟系统的仿真和程序
- 混合信号设计中DEF文件创建流程
- 美国大学生数学建模竞赛(美赛)详细教程:从组队到赛后总结全攻略
- 病媒生物孳生地调查和治理工作方案.docx
- 保姆的工作标准.docx
- 病媒生物防制指南.docx
评论0