# text_classification
中文文档分类数据集
配套陈旸老师的《人人都听得懂的清华大学数据挖掘》里的练习
数据说明:
1、文档共有4中类型:女性、体育、文学、校园
2、训练集放到train文件夹里,测试集放到test文件夹里。停用词放到stop文件夹里。
请使用朴素贝叶斯分类对训练集进行训练,并对测试集进行验证,并给出测试集的准确率。
没有合适的资源?快使用搜索试试~ 我知道了~
Python数据分析和机器学习练习.zip
共64个文件
py:53个
gitattributes:6个
md:3个
需积分: 5 0 下载量 11 浏览量
2024-04-16
20:13:52
上传
评论
收藏 60KB ZIP 举报
温馨提示
Python数据分析和机器学习练习.zip
资源推荐
资源详情
资源评论
收起资源包目录
Python数据分析和机器学习练习.zip (64个子文件)
content
eleme
test5.py 4KB
download.py 2KB
createdatabase.py 870B
originaldata.py 4KB
朴素贝叶斯
test1.py 3KB
text_classification
README.md 443B
test_classification.py 4KB
beiyesi.py 447B
.vscode
settings.json 70B
Apriori
pachong.py 2KB
test.py 436B
apriori.py 526B
logistic_regression
logistic.py 5KB
breast_cancer
SVM.py 2KB
breast_svm.py 2KB
breast_linearsvm.py 2KB
K-Means
K-Means-image.py 2KB
K-Means-team.py 813B
kmeans-master
.gitattributes 66B
kmeans2.py 1KB
kmeans1.py 1KB
kmeans3.py 1KB
random_forest
card.py 4KB
test1.py 677B
test2.py 865B
credit_default-master
.gitattributes 66B
credit_default_analysis.py 3KB
决策树
Titanic_Data
.gitattributes 66B
README.md 307B
cartyuce.py 1KB
titanic.py 2KB
cartfenlei.py 1KB
time-series-analysis
time_series.py 3KB
bitcoin-master
.gitattributes 66B
bitcoin_analysis.py 3KB
test.py 1KB
AdaBoost
adaboost.py 609B
adaboost_compare.py 2KB
test.py 26B
KNN
compare.py 1KB
KNN.py 1KB
微博
login.py 1KB
.gitignore 2KB
EM
em.py 2KB
EM_data
.gitattributes 66B
PageRank
PageRank-master
.gitattributes 66B
email_pr.py 3KB
pagerank2.py 4KB
pagerank1.py 368B
README.md 63B
wordcloud
text.py 2KB
maobuyi.py 3KB
test.py 1KB
奇葩说
convertmovieid.py 948B
usercommentdata.py 1KB
getdata.py 5KB
usersex.py 1KB
convertweek.py 839B
usercommentlength.py 968B
convertcommentlength.py 931B
databasecreater.py 875B
usercommentcount.py 2KB
usercommentjieba.py 3KB
convertdata.py 898B
共 64 条
- 1
资源评论
生瓜蛋子
- 粉丝: 3824
- 资源: 5370
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功