没有合适的资源?快使用搜索试试~ 我知道了~
nlp-course:csc nlp课程作业
共127个文件
txt:46个
java:31个
xml:31个
需积分: 9 0 下载量 176 浏览量
2021-06-24
16:09:49
上传
评论
收藏 1.92MB ZIP 举报
温馨提示
hw1. 将文本解析为句子 src 单元测试(解析器成功“获取”的文本示例): : 语料库结果:F1 = 0.985,精度 = 0.988,召回率 = 0.982,准确度 = 0.985,tp = 8205955,fp = 96511,fn = 145627 hw01_data 结果:F1 = 0.980,精度 = 0.975,召回率 = 0.986,准确度 = 0.980,tp = 85468,fp = 2172,fn = 1170 由于错误的框架,有很多问题,在大数据上,甚至很明显你不能专注于引号 - 我禁用了这个功能。 目前尚不清楚缩写后的大写字母如何处理。 hw2。 按主题对新闻进行排序 在我的集合(4x10 = 40 个文档)中,卡方只给出了 3 个属性,这还不够。 尝试对所有属性进行分类在 SMO 中仅产生 20% 的准确率。 我没有看别人,我开始改进功能。 我
资源推荐
资源详情
资源评论
收起资源包目录
nlp-course:csc nlp课程作业 (127个子文件)
necr-romip-train.csv 992KB
label-sentence.csv 74KB
mensions.csv 140B
necr-romip-train.data 1.47MB
necr-train.data 1.05MB
necr-simple-train.data 1.04MB
necr-test.data 263KB
necr-simple-test.data 262KB
necr-romip-test.data 262KB
nlp-erofeev.iml 3KB
FactsRetrieverTest.java 12KB
SentenceParserTest.java 11KB
NaiveBayesClassifierUtils.java 9KB
CorpusReader.java 8KB
FeaturesSelector.java 7KB
FactsRetriever.java 7KB
DataProcessingUtils.java 5KB
StatisticsTest.java 5KB
TweetsRetriever.java 4KB
SentenceParser.java 4KB
ChiSquareTest.java 4KB
StatisticsResult.java 4KB
Statistics.java 4KB
Fact.java 3KB
TrainingDataFormatter.java 3KB
Classifier.java 3KB
StructuredTextParser.java 3KB
BestWordsCollector.java 2KB
CorpusReaderTest.java 2KB
OpcorporaReader.java 2KB
HW1DataReader.java 2KB
DataProcessingUtilsTest.java 2KB
NaiveBayesClassifierUtilsTest.java 2KB
Text.java 2KB
CRFReadUtil.java 2KB
NaiveBayesClassifier.java 2KB
CorpusFactsConverter.java 1KB
StructuredTextParserText.java 1KB
TweetsRetrieverTest.java 872B
ErrorsFinder.java 548B
WekaExplorerLauncher.java 280B
tweets.json 449KB
README.md 22KB
necr-romip-train.model 890KB
necr-train.model 712KB
necr-simple-train.model 641KB
.name 3B
11999.news 107KB
23158.news 48KB
template 158B
smile-pos.txt 236KB
smile-neg.txt 219KB
romip-facts.txt 199KB
negative-texts-learn.txt 32KB
google-pos.txt 12KB
pos.txt 12KB
id2-src.txt 10KB
google-neg.txt 10KB
neg.txt 9KB
negative-texts-test.txt 7KB
1.txt 4KB
1.txt 4KB
1.txt 3KB
niceAttrs.txt 3KB
2.txt 3KB
2.txt 3KB
1.txt 3KB
positive-texts-learn.txt 2KB
1.txt 2KB
1.txt 2KB
2.txt 2KB
3.txt 2KB
3.txt 2KB
most-neg-words.txt 2KB
most-pos-words.txt 2KB
3.txt 2KB
3.txt 2KB
2.txt 2KB
2.txt 2KB
2.txt 2KB
2.txt 2KB
1.txt 2KB
3.txt 1KB
1.txt 1KB
1.txt 1KB
3.txt 1KB
3.txt 1KB
3.txt 1KB
2.txt 1KB
1.txt 1KB
positive-texts-test.txt 932B
3.txt 901B
2.txt 805B
tmp-results.txt 769B
3.txt 764B
2.txt 253B
ids2-4.xml 630KB
id5.xml 335KB
id2.xml 232KB
workspace.xml 95KB
共 127 条
- 1
- 2
资源评论
HomeTalk
- 粉丝: 25
- 资源: 4588
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功