没有合适的资源?快使用搜索试试~ 我知道了~
Spam-Classification-Project:针对我的AI入门课程的学期末项目的Spam分类器项目。 我们是四人一组。...
共10个文件
ipynb:4个
pptx:1个
md:1个
需积分: 10 2 下载量 155 浏览量
2021-03-03
05:25:43
上传
评论
收藏 4.08MB ZIP 举报
温馨提示
垃圾邮件分类器 使用CountVectorizer和Tf-idf Vectorizer构建的垃圾邮件分类器。 数据集来源: ://www.kaggle.com/uciml/sms-spam-collection-dataset我们在项目中采用了Upsampling和Cross-val,并建立了以下模型: 使用CountVectorizer的不平衡数据集的朴素贝叶斯模型 使用Tf-idf Vectorizer的不平衡数据集的朴素贝叶斯模型 使用CountVectorizer进行交叉验证的朴素贝叶斯模型 使用Tf-idf Vectorizer进行交叉验证的朴素贝叶斯模型 决策树模型具有不平衡的数据集,交叉估值和上采样数据。 (共6个型号) 对于EDA,我们创建了以下内容: 火腿和垃圾邮件中最常见单词的直方图 火腿和垃圾邮件中最常见的单词的Wordcloud 条形图显示垃圾邮件和火腿邮
资源推荐
资源详情
资源评论
收起资源包目录
Spam-Classification-Project-master.zip (10个子文件)
Spam-Classification-Project-master
README.md 1000B
AI-Project.pptx 2.29MB
Decision-Tree
decisiontree Crossvalidation.ipynb 1.1MB
decicsion tree up sampled .ipynb 2.19MB
decisionTree unsampled.ipynb 1.17MB
smsspamcollection
readme 6KB
SMSSpamCollection 467KB
Naive-Bayes
spam.csv 493KB
comment.png 137KB
Final_Project_NB.ipynb 569KB
共 10 条
- 1
资源评论
卡卡乐乐
- 粉丝: 34
- 资源: 4679
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功