# ML--Native-Bayes
## 描述:
* 实现一个朴素贝叶斯分类器,用于新闻文本分类;
* 利用了TF-IDF算法进行特征提取,并构建特征库;
* 主要使用nltk自然语言处理工具包;
* 数据集来自爬虫在国外新闻网站采集的各类新闻;
* src-02 是新闻分类器,src是《机器学习实战》一书中提供的代码;
* material 目录是挑选的各类新闻集合,用于构建特征库以及训练集和测试集;
* test 目录是分类器训练集和测试集;
* features 目录是提取的各类文本的特征库和保存的训练模型;
* verify 目录是用来测试模型的各类新闻数据;
* model 目录是存放的训练模型,解压使用;
* 目前分类器可以对英语的文化,政治,环境,能源,科技,环境,经济进行分类,对法语的经济,互联网,政治,社会进行分类;
* 分类准确率为86%;
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
机器学习基于Python朴素贝叶斯的新闻文本分类项目源码(下载即用).zip已获导师指导并通过的97分的高分大作业设计项目,可作为课程设计和期末大作业,下载即用无需修改,项目完整确保可以运行。 机器学习基于Python朴素贝叶斯的新闻文本分类项目源码(下载即用).zip已获导师指导并通过的97分的高分大作业设计项目,可作为课程设计和期末大作业,下载即用无需修改,项目完整确保可以运行。 机器学习基于Python朴素贝叶斯的新闻文本分类项目源码(下载即用).zip已获导师指导并通过的97分的高分大作业设计项目,可作为课程设计和期末大作业,下载即用无需修改,项目完整确保可以运行。 机器学习基于Python朴素贝叶斯的新闻文本分类项目源码(下载即用).zip已获导师指导并通过的97分的高分大作业设计项目,可作为课程设计和期末大作业,下载即用无需修改,项目完整确保可以运行。 机器学习基于Python朴素贝叶斯的新闻文本分类项目源码(下载即用).zip已获导师指导并通过的97分的高分大作业设计项目,可作为课程设计和期末大作业,下载即用无需修改,项目完整确保可以运行。
资源推荐
资源详情
资源评论
收起资源包目录
机器学习基于Python朴素贝叶斯的新闻文本分类项目源码 (1).zip (35个子文件)
机器学习基于Python朴素贝叶斯的新闻文本分类项目源码
so.xlsx 1.3MB
ec.xlsx 866KB
src
__init__.py 128B
main.py 948B
bayes.py 2KB
in.xlsx 936KB
po.xlsx 1.27MB
词性标注规范.docx 44KB
model
my_classifier_pickle.7z 12.09MB
test
energy.xlsx 2.19MB
political_fr.xlsx 1.69MB
social_fr.xlsx 1.76MB
security.xlsx 1.47MB
culture.xlsx 1.81MB
economy_fr.xlsx 1.21MB
environment.xlsx 1.77MB
economy.xlsx 1.72MB
technology.xlsx 1.34MB
political.xlsx 1.62MB
international_fr.xlsx 1.39MB
verify
energy.xlsx 42KB
culture.xlsx 377KB
environment.xlsx 143KB
economy.xlsx 133KB
technology.xlsx 39KB
political.xlsx 263KB
.gitignore 32B
README.md 924B
src_02
__init__.py 128B
nltk_bayes_classifier.py 5KB
main.py 8KB
export_data.py 936B
text_processing.py 10KB
import_data.py 2KB
config.py 1KB
共 35 条
- 1
资源评论
不安分的小女孩
- 粉丝: 9200
- 资源: 1990
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功