没有合适的资源?快使用搜索试试~ 我知道了~
快速数据挖掘数据分析实战RapidMiner工具应用第12章 文本挖掘V1.1.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
5星 · 超过95%的资源 2 下载量 112 浏览量
2021-08-07
22:45:11
上传
评论
收藏 443KB PDF 举报
温馨提示
试读
9页
12.1 应用场景 垃圾、邮件检测 语言种类检测 客户反馈分析、微博评论情感分析 … 12.2学习目标 在学习完本章后,您应能够: 解释什么是文本挖掘、如何使用文本挖掘,以及使用文本挖掘有哪些好处。 识别文本可能采取的各种格式,以便进行文本挖掘。 连接至文本,并将其导入为文本挖掘模型的数据来源。 在 RapidMiner 中开发一个文本挖掘模型,其中包括常用的文本操作符,例如tokenization、stop word filtering等。 对文本挖掘结果应用其他数据挖掘模型,以便根据文本分析结果预测或分类。 12.3文本挖掘概览 本章介绍文本分类。由于大部分交流信息以文本格式保存,文本分类是文本挖掘中的一个重要主题。我们将建立一个RapidMiner挖掘流程,来学习垃圾和我们实际想阅读的之间的区别。然后我们将应用此学习到的模型到新的中,来确定其是否为垃圾。垃圾是许多熟悉主题中的一种,自然地,我们由此就开始动手工作。用于垃圾分类的相同的技术可以在许多其他文本挖掘领域中使用。 以下为我们主要执行的挖掘步骤: – 安装文本挖掘插件 – 加载数据集到 RapidMiner中 – 检查这些文本 – 处理这些文本 – 使用 Naïve Bayes 算法构造一个文本分类模型 – 验证模型 – 应用模型到未分类的数据中
资源推荐
资源评论
资源评论
- cxxlllcyy1234562021-12-14用户下载后在一定时间内未进行评价,系统默认好评。
- 2301_766735942023-03-04总算找到了想要的资源,搞定遇到的大问题,赞赞赞!
passionSnail
- 粉丝: 407
- 资源: 5624
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功