没有合适的资源?快使用搜索试试~ 我知道了~
Text-classification:不使用现有的库使用朴素贝叶斯和感知机实现文本分类
共1个文件
md:1个
需积分: 15 16 下载量 66 浏览量
2021-03-17
15:52:12
上传
评论 2
收藏 2KB ZIP 举报
温馨提示
文字分类 训练一个分类器(KNN,SVM),对文本数据进行分类,类别可包括体育,财经,房地产,家居,教育等十个类别。 文本分类的一般流程可以分为五步:(1)对文本进行预处理,包括分词操作和替换词去除等;(2)特征提取与特征选择,选择文本特征提取方法,替代特征进行选择(3)文本表示,选择合适的方法表示选择的特征,作为分类的依据;(4)分类器构建,选择合适的分类算法训练得到对应的文本分类器;结果评估,选择合适的评估指标,对分类结果进行评价 #实验内容1.构建数据集2.数据预处理(分词,去除重置词)3.生成数据集的特征矩阵4.使用朴素贝叶斯模型进行处理5.使用SVM模型进行处理 本次实验使用到的数据集为实验预先提供的新闻训练集,新闻测试集,以及替换词。训练集和测试集中包括共10个种类的新闻,但所有的新闻都在一个文档里,也查看训练集和数据集内容,发现共有十个新闻分类,分别是“财经”,“资产”, “
资源推荐
资源详情
资源评论
收起资源包目录
Text-classification-main.zip (1个子文件)
Text-classification-main
README.md 4KB
共 1 条
- 1
资源评论
LiuTitanium
- 粉丝: 23
- 资源: 4684
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功