# 垃圾短信识别
> 浙江大学《机器学习及其应用》作业,垃圾短信识别。
>
> 项目来源于:<https://mo.zju.edu.cn/workspace/5fc0eadb7ceb533cc49bce17?type=app&tab=2>(只有我自己的号能打开)
具体处理信息及说明查看 `main.ipynb`。
**注意先下载数据集 [sms_pub.csv.zip](https://wwtk.lanzoub.com/i3eFAk6r4cj) 并解压到 `Spam-Message-Recognition/datasets/5f9ae242cae5285cd734b91e-momodel/` 目录下**。
由于训练数据中正负样本不均衡(正负样本⽐例约为 1:10),将会导致拟合效果较差,因此读⼊后在负样本中随机取出⼀定数量作为实验⽤样本,使正负样本数量相同。
借助 sklearn 中的 `TfidfVectorizer` 来实现⽂本的向量化,之后用朴素贝叶斯进行分类。
最后在测试集上评估模型
- f1-score:0.9705720403793209
- 准确率:0.969614655716993
没有合适的资源?快使用搜索试试~ 我知道了~
基于python的垃圾短信识别源码+项目说明(文本分类,朴素贝叶斯方法).zip
共19个文件
png:7个
md:4个
txt:2个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 157 浏览量
2024-01-24
00:07:38
上传
评论
收藏 6.46MB ZIP 举报
温馨提示
【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学、电子信息等专业的课程设计、期末大作业和毕设项目,作为参考资料学习借鉴。 3、本资源作为“参考资料”如果需要实现其他功能,需要能看懂代码,并且热爱钻研,自行调试。 基于python的垃圾短信识别源码+项目说明(文本分类,朴素贝叶斯方法).zip基于python的垃圾短信识别源码+项目说明(文本分类,朴素贝叶斯方法).zip基于python的垃圾短信识别源码+项目说明(文本分类,朴素贝叶斯方法).zip基于python的垃圾短信识别源码+项目说明(文本分类,朴素贝叶斯方法).zip基于python的垃圾短信识别源码+项目说明(文本分类,朴素贝叶斯方法).zip基于python的垃圾短信识别源码+项目说明(文本分类,朴素贝叶斯方法).zip基于python的垃圾短信识别源码+项目说明(文本分类,朴素贝叶斯方法).zip基于python的垃圾短信识别源码+项目说明(文本分类,朴素贝叶斯方法).zip基于python的垃圾短信识别源码+项目说明(文本分类,朴素贝叶斯方法).zip
资源推荐
资源详情
资源评论
收起资源包目录
基于python的垃圾短信识别源码+项目说明(文本分类,朴素贝叶斯方法).zip (19个子文件)
code_20105
picture
3.png 4KB
1.png 5KB
4.png 4KB
.ipynb_checkpoints
2-checkpoint.png 4KB
3-checkpoint.png 4KB
1-checkpoint.png 5KB
2.png 4KB
main.ipynb 33KB
predict.py 1KB
datasets
5f9ae242cae5285cd734b91e-momodel
scu_stopwords.txt 7KB
_OVERVIEW.md 1KB
scu_stopwords.txt 7KB
.gitignore 10B
sms_eval.csv 8KB
train.py 2KB
results
_README.md 140B
pipeline.model 15.54MB
tb_results
README.md 142B
README.md 899B
共 19 条
- 1
资源评论
土豆片片
- 粉丝: 1567
- 资源: 5642
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功