# SvmSentiment
情感分析 机器学习 微博 libsvm
原理:
1.本项目为基于机器学习的短文本情感分析。
2.本项目根据中科院分词和训练好的词袋对训练的文本进行编号,去停用词,过滤噪音,编号,数据预处理,做成测试集(i_data_test.txt)
3.通过训练好的模型model.txt对i_data_test.txt进行测试。
4.其中模型model.txt、词袋wordss.txt的训练请看另一个项目:https://github.com/18846194802/libsvm_weibo_sentiment_train
使用:
1.将文本放入initial_data.txt里面,运行Start.java即可
注意:
1.initial_data.txt 编码为ANSI,请勿保存为utf8,如若如若想改为
utf8请将各个类代码中的GBK进行修改。
2.中科院分词可能过期,若过期,请到官网更新更新license(更换NLPIR.user)
地址:https://github.com/NLPIR-team/NLPIR/tree/master/License
如果有用欢迎点个星星
没有合适的资源?快使用搜索试试~ 我知道了~
基于机器学习的微博情感分析微博源码+项目说明.zip
共104个文件
txt:17个
pdat:15个
map:15个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 100 浏览量
2024-01-19
22:25:35
上传
评论 1
收藏 20.34MB ZIP 举报
温馨提示
1、该资源内项目代码经过严格调试,下载即用确保可以运行! 2、该资源适合计算机相关专业(如计科、人工智能、大数据、数学、电子信息等)正在做课程设计、期末大作业和毕设项目的学生、或者相关技术学习者作为学习资料参考使用。 3、该资源包括全部源码,需要具备一定基础才能看懂并调试代码。 基于机器学习的微博情感分析微博源码+项目说明.zip基于机器学习的微博情感分析微博源码+项目说明.zip基于机器学习的微博情感分析微博源码+项目说明.zip基于机器学习的微博情感分析微博源码+项目说明.zip基于机器学习的微博情感分析微博源码+项目说明.zip基于机器学习的微博情感分析微博源码+项目说明.zip基于机器学习的微博情感分析微博源码+项目说明.zip基于机器学习的微博情感分析微博源码+项目说明.zip基于机器学习的微博情感分析微博源码+项目说明.zip基于机器学习的微博情感分析微博源码+项目说明.zip基于机器学习的微博情感分析微博源码+项目说明.zip基于机器学习的微博情感分析微博源码+项目说明.zip基于机器学习的微博情感分析微博源码+项目说明.zip
资源推荐
资源详情
资源评论
收起资源包目录
基于机器学习的微博情感分析微博源码+项目说明.zip (104个子文件)
BiWord.big 3.36MB
.classpath 488B
ICTCLAS30.ctx 36KB
NLPIR.ctx 36KB
nr.ctx 2KB
CETrans.dict 2.22MB
NLPIR.dll 2.24MB
DocExtractor.dll 1.64MB
License.dll 82KB
nr.fsa 3KB
.gitignore 17B
jna-4.0.0.jar 893KB
libsvm.jar 54KB
NlpirTest.java 14KB
svm_train.java 8KB
NlpirMethod.java 8KB
NlpirLib.java 6KB
svm_predict.java 5KB
Step1.java 2KB
Step3.java 1KB
Step6.java 1KB
SvmDemo.java 1KB
Step5.java 1014B
OSInfo.java 969B
Step2.java 911B
Step4.java 675B
Start.java 592B
NewWord.lst 3.4MB
UserDefinedDict.lst 27B
Irrel2regular.map 1.35MB
UTF2GBK.map 279KB
GBKC2GBK.map 279KB
GBKA2UTF.map 279KB
GBK2BIG.map 279KB
GBK2UTF.map 279KB
GBK2GBKC.map 279KB
UTF2GBKA.map 279KB
BIG2GBK.map 279KB
location.map 78KB
ICTPOS.map 422B
PKU.map 323B
PKU_First.map 300B
ICTCLAS_First.map 288B
NLPIR_First.map 288B
README.md 929B
CodeTrans.model 774KB
English.pdat 5.79MB
GranDict.pdat 1.89MB
Dict.pdat 1.86MB
CoreDict.pdat 1.62MB
ne.pdat 1.11MB
sentiment.pdat 902KB
UTF8.pdat 544KB
GBKA.pdat 538KB
GBKC.pdat 538KB
GBK.pdat 536KB
BIG5.pdat 457KB
location.pdat 407KB
FieldDict.pdat 256KB
KeyBlackList.pdat 256KB
UserDict.pdat 31KB
English.pos 4.78MB
CoreDict.pos 1.7MB
GranDict.pos 1.7MB
ne.pos 1.22MB
FieldDict.pos 28B
org.eclipse.jdt.core.prefs 598B
org.eclipse.core.resources.prefs 57B
.project 396B
nr.role 1.68MB
model.txt 6.74MB
model2.txt 6.66MB
test.txt 606KB
40000all_words.txt 233KB
wordss.txt 219KB
initial_data1.txt 33KB
stopwords.txt 190B
i_data_ppl_nihui.txt 42B
userfilterword.txt 34B
i_data_ppl_3.txt 28B
i_data_ppl_2.txt 28B
i_data_ppl.txt 22B
i_data_ppl_1.txt 22B
i_data_test.txt 20B
initial_data.txt 20B
predict.txt 4B
Data.txt 2B
charset.type 64KB
English.ung 1.85MB
stop.ung 376KB
sentiment.ung 215KB
CoreDict.unig 467KB
NLPIR.user 3KB
English.wordlist 3.35MB
Dict.wordlist 1.03MB
ne.wordlist 653KB
sentiment.wordlist 400KB
UTF8.wordlist 186KB
GBKC.wordlist 163KB
GBK.wordlist 163KB
共 104 条
- 1
- 2
资源评论
辣椒种子
- 粉丝: 3400
- 资源: 5725
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功