没有合适的资源?快使用搜索试试~ 我知道了~
TextParser:项目中使用了斯坦福的NLP工具,主要用来做中文文本的解析处理等
共49个文件
class:21个
java:18个
txt:5个
需积分: 19 0 下载量 131 浏览量
2021-04-30
18:38:35
上传
评论
收藏 302KB ZIP 举报
温馨提示
TextParser 项目中使用了斯坦福的NLP工具,主要用来做中文文本的解析处理等。 lib文件夹过大,故没有上传。 1.还需要下载stanford-segmenter-3.4.1.jar、stanford-segmenter-3.4.1-sources.jar、stanford-segmenter-3.4.1-javadoc.jar 将以上三个jar放入lib文件夹中,并导入工程。 2.再新建一个data文件夹,并放入lib文件夹中。其中包括dict文件夹、arabic-segmenter-atb+bn+arztrain.ser.gz、 ctb.gz、ctb.prop、dict-chris6.ser.gz、norm.simp.utf8。以上都是一些词典数据等。
资源推荐
资源详情
资源评论
收起资源包目录
TextParser-master.zip (49个子文件)
TextParser-master
.gitignore 189B
MySource
cn
free
textparser
segandfilter
Log.java 183B
TextFiles.java 3KB
ReadFiles.java 10KB
BasicSegmenter.java 1KB
MySegmenter.java 4KB
features
AllWords.java 5KB
Sort.java 2KB
NonRepeatWords.java 3KB
Statistics.java 9KB
stop_words
stopwordslist.txt 95KB
stoplist.txt 144KB
stop_words.txt 108KB
src
cn
free
textparser
merge.java 3KB
TF.java 2KB
total.java 1KB
CHI.java 5KB
DF.java 5KB
tfidf.java 14KB
VSM
VsmMain.java 3KB
DF.java 4KB
tfidf.java 8KB
bin
cn
free
textparser
TF.class 3KB
total.class 2KB
segandfilter
BasicSegmenter.class 2KB
ReadFiles$1.class 1KB
ReadFiles.class 10KB
TextFiles.class 3KB
MySegmenter.class 4KB
TextFiles$1.class 1KB
Log.class 447B
tfidf.class 11KB
merge.class 3KB
DF.class 4KB
CHI.class 5KB
features
Sort.class 3KB
Statistics.class 9KB
NonRepeatWords$1.class 1KB
AllWords.class 6KB
NonRepeatWords.class 4KB
VSM
VsmMain.class 5KB
tfidf.class 8KB
DF.class 4KB
.classpath 852B
LICENSE 34KB
README.md 559B
.project 369B
test
des
1.txt 23KB
src
1.txt 18KB
共 49 条
- 1
资源评论
FeMnO
- 粉丝: 20
- 资源: 4608
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功