scik-learn 中文文本分类算法的实现
- 复旦大学的数据集,总共有9804篇文本,分为20个类别
```
语料库的文件目录:
corpus目录
类别A
----文件1.txt
----文件2.txt
类别B
----文件3.txt
----文件4.txt
#########################
```
- 使用`from sklearn.datasets.base import Bunch` 永持久化保存语料库的`content,label,filename…… ` 等信息
- 分别实现`k-means,KNN,SVM,贝叶斯,topic_extraction等`,同时评估分类的准确率,召回率和F值。
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
基于scik-learn 实现k-means,KNN,SVM、topic_extraction等算法python源码.zip 个人大四的毕业设计、经导师指导并认可通过的高分设计项目,评审分96.5分。主要针对计算机相关专业的正在做毕设的学生和需要项目实战练习的学习者,也可作为课程设计、期末大作业。 <资源说明> 不懂运行,下载完可以私聊问,可远程教学 该资源内项目源码是个人的毕设或者课设、作业,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96.5分,放心下载使用! 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。
资源推荐
资源详情
资源评论
收起资源包目录
基于scik-learn 实现k-means,KNN,SVM,贝叶斯,topic_extraction等算法python源码.zip (13个子文件)
evaluation.py 1KB
textprocess.py 16KB
test_svm_evaluation.py 1KB
textprocess.pyc 10KB
evaluation.pyc 1KB
topic_extraction.py 1KB
navibayers.py 2KB
ch_stop_words.txt 6KB
k-means.py 1KB
KNN.py 2KB
SVM.py 2KB
k-means-svd.py 2KB
README.md 557B
共 13 条
- 1
资源评论
Scikit-learn
- 粉丝: 4143
- 资源: 1256
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功