# ML--Native-Bayes
## 描述:
* 实现一个朴素贝叶斯分类器,用于新闻文本分类;
* 利用了TF-IDF算法进行特征提取,并构建特征库;
* 主要使用nltk自然语言处理工具包;
* 数据集来自爬虫在国外新闻网站采集的各类新闻;
* src-02 是新闻分类器,src是《机器学习实战》一书中提供的代码;
* material 目录是挑选的各类新闻集合,用于构建特征库以及训练集和测试集;
* test 目录是分类器训练集和测试集;
* features 目录是提取的各类文本的特征库和保存的训练模型;
* verify 目录是用来测试模型的各类新闻数据;
* model 目录是存放的训练模型,解压使用;
* 目前分类器可以对英语的文化,政治,环境,能源,科技,环境,经济进行分类,对法语的经济,互联网,政治,社会进行分类;
* 分类准确率为86%;
妄北y
- 粉丝: 2w+
- 资源: 1万+
最新资源
- PLC 西门子smart200 锁机 最新原创有图片证明配对应西门子smart700IE V3程序,分期期付款 动态验证码,无限次加密 程序例程
- 汇编语言基础入门知识和案例
- 基于ssm的就业信息管理系统源码(java毕业设计完整源码+LW).zip
- 土豆缺陷识别数据集,使用yolov11格式标注,8034张图片,识别率在81.2%,可识别损坏的土豆缺陷土豆,病菌感染的土豆,正常土豆等
- 无刷电机FOC控制量产方案,原理图,PCB,源代码,元器件BOM 可用于电动三轮,电动车等代步工具上,代码基于C语言,功能丰富,具有刹车功能、助力功能、欠压检测、巡航功能、防盗、自学习、故障显示等功
- 土豆缺陷识别数据集,使用yolov9格式标注,8034张图片,识别率在81.2%,可识别损坏的土豆缺陷土豆,病菌感染的土豆,正常土豆等
- matlab绘图的.m文件,里面涉及到字体大小,横纵坐标调整等操作,有需要自取
- 建筑地震保护系统建模与分析:基于小振幅及榫头锁入条件的研究
- 基于ssm的二手交易平台网站源码(java毕业设计完整源码+LW).zip
- 土豆缺陷识别数据集,使用yolov8格式标注,8034张图片,识别率在81.2%,可识别损坏的土豆缺陷土豆,病菌感染的土豆,正常土豆等
- 基于ssm的家用电器销售网站源码(java毕业设计完整源码+LW).zip
- 不同颜色正方体检测59-YOLO(v5至v11)、COCO、CreateML、Paligemma、TFRecord、VOC数据集合集.rar
- 基于ssm的影院管理系统源码(java毕业设计完整源码+LW).zip
- 土豆缺陷识别数据集,使用yolov7格式标注,8034张图片,识别率在81.2%,可识别损坏的土豆缺陷土豆,病菌感染的土豆,正常土豆等
- 开发者专用浏览器 免费浏览器 - 干净好用的浏览器
- java超市综合管理信息系统源代码.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈