没有合适的资源?快使用搜索试试~ 我知道了~
-DSI-Project03:NLP Subreddit分类
共1个文件
md:1个
需积分: 5 0 下载量 201 浏览量
2021-03-19
16:16:26
上传
评论
收藏 2KB ZIP 举报
温馨提示
项目3-Subreddit上的Web API和分类 该项目的目的是从Reddit中选择两个子Reddit,并使用自然语言处理和分类模型将帖子分类为正确的子Reddit。 我选择潜水潜水和远足潜水作为我感兴趣的两个主题,因为这两个主题都在同一主要社区“旅行”下,但又有足够的差异,因此应该有可能训练机器学习模型。 问题陈述 近年来,流浪汉变得越来越世俗,对冒险的渴望增加了。水肺潜水和远足是一项冒险运动,使我们能够探索水上和水下的世界。因此,对于需要在互联网人群中寻找冒险旅行者的旅行社而言。因此,通过了解人们用来讨论和搜索水肺潜水和远足的惯用语,可以帮助这些旅行社发现他们的顾客。 执行摘要 与50%的分类帖子的基线准确性得分(无论这些帖子是否来自水肺潜水)相比,最好的分类模型是带有计数矢量化器的逻辑回归模型,该模型的准确性得分为89.85%。该模型的性能优于多项朴素贝叶斯模型和K最近邻模型。 增
资源推荐
资源详情
资源评论
收起资源包目录
-DSI-Project03-main.zip (1个子文件)
-DSI-Project03-main
README.md 4KB
共 1 条
- 1
资源评论
晔晔匠
- 粉丝: 23
- 资源: 4650
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功