没有合适的资源?快使用搜索试试~ 我知道了~
基于scikit-learn的BBS垃圾文本分类器
共4个文件
md:1个
gitignore:1个
txt:1个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 168 浏览量
2022-05-09
16:59:15
上传
评论
收藏 3KB ZIP 举报
温馨提示
论坛垃圾帖分类 scikit-learn + jieba + flask 运行 pip install -r requirements.txt gunicorn -w 2 -b 127.0.0.1:5000 main:app 学习 curl 'http://localhost:5000/train/?content=两个黄鹂鸣翠柳,一行白鹭上青天&type=ham' 会生成文件tmpVector.pkl*缓存HashingVectorizer向量,方便分类时使用,无需每次查数据仓库文件 文件train_data0.txt``train_data1.txt,数据仓库,存储已学习的文本 分类 curl 'http://localhost:5000/predict/?content=无知者无畏' 优缺点 速度 - 数据转化成查询向量,并且缓存起来不用每次从资料库计算,应该比较快 注意 - 除了垃圾要学,非垃圾的也要学,若不学非垃圾数据,分类器会将所有都判断成垃圾
资源推荐
资源详情
资源评论
收起资源包目录
sklearn-bbs-classifier-master.zip (4个子文件)
sklearn-bbs-classifier-master
main.py 3KB
readme.md 1KB
requirements.txt 59B
.gitignore 32B
共 4 条
- 1
资源评论
自不量力的A同学
- 粉丝: 46
- 资源: 2711
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功