没有合适的资源?快使用搜索试试~ 我知道了~
基于scikit-learn的BBS垃圾文本分类器
共4个文件
md:1个
gitignore:1个
txt:1个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
5星 · 超过95%的资源 1 下载量 34 浏览量
2022-05-09
16:59:15
上传
评论
收藏 3KB ZIP 举报
温馨提示
论坛垃圾帖分类 scikit-learn + jieba + flask 运行 pip install -r requirements.txt gunicorn -w 2 -b 127.0.0.1:5000 main:app 学习 curl 'http://localhost:5000/train/?content=两个黄鹂鸣翠柳,一行白鹭上青天&type=ham' 会生成文件tmpVector.pkl*缓存HashingVectorizer向量,方便分类时使用,无需每次查数据仓库文件 文件train_data0.txt``train_data1.txt,数据仓库,存储已学习的文本 分类 curl 'http://localhost:5000/predict/?content=无知者无畏' 优缺点 速度 - 数据转化成查询向量,并且缓存起来不用每次从资料库计算,应该比较快 注意 - 除了垃圾要学,非垃圾的也要学,若不学非垃圾数据,分类器会将所有都判断成垃圾
资源推荐
资源详情
资源评论
收起资源包目录
sklearn-bbs-classifier-master.zip (4个子文件)
sklearn-bbs-classifier-master
main.py 3KB
readme.md 1KB
requirements.txt 59B
.gitignore 32B
共 4 条
- 1
资源评论
- n_ycj2024-11-18资源有一定的参考价值,与资源描述一致,很实用,能够借鉴的部分挺多的,值得下载。
自不量力的A同学
- 粉丝: 774
- 资源: 2787
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 使用NetBeans连接SQLserver2008数据库教程中文WORD版最新版本
- XPath实例中文WORD版最新版本
- XPath语法规则中文WORD版最新版本
- XPath入门教程中文WORD版最新版本
- ORACLE数据库管理系统体系结构中文WORD版最新版本
- Sybase数据库安装以及新建数据库中文WORD版最新版本
- tomcat6.0配置oracle数据库连接池中文WORD版最新版本
- hibernate连接oracle数据库中文WORD版最新版本
- MyEclipse连接MySQL的方法中文WORD版最新版本
- MyEclipse中配置Hibernate连接Oracle中文WORD版最新版本
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功