没有合适的资源?快使用搜索试试~ 我知道了~
org.lappsgrid.mallet
共47个文件
java:12个
classifier:12个
xml:8个
需积分: 5 0 下载量 131 浏览量
2021-05-09
10:09:31
上传
评论
收藏 18.92MB ZIP 举报
温馨提示
org.lappsgrid.mallet 该存储库包含来自UMASS Amherst的NLP工具。 总共有6种工具。 这些工具是文档分类器,序列标记器,主题建模器以及它们各自的培训器。 输入 除Sequence Tagger之外的每个工具都需要一个LAPPS Grid Data对象,该对象带有鉴别符: 和有效载荷中的文本。 非培训工具的有效负载中的文本是我们希望分析的文本。 培训工具的有效负载中的文本未使用,因此可以为null 。 序列标记符要求使用作为鉴别符,并在Data对象中使用适当的令牌。 参数 每个工具也将需要一些参数。 文件分类器 参数名称 描述 默认值 分类器 分类器模型的路径 “ /masc_500k_texts.classifier” 顺序标记 参数名称 描述 默认值 模型 序列标记器模型的路径 “ /masc_500k_texts.model” 主题建模器 参数名称 描
资源推荐
资源详情
资源评论
收起资源包目录
org_lappsgrid_mallet-master.zip (47个子文件)
org.lappsgrid.mallet-master
.gitignore 269B
src
main
resources
masc_500k_texts.inferencer 1.16MB
cc
mallet
util
resources
logging.properties 2KB
masc_500k_texts_topic_keys.txt 3KB
masc_500k_texts.model 1.04MB
masc_500k_texts.classifier 4.97MB
java
org
lappsgrid
mallet
TrainSequenceTagging.java 6KB
TopicModeling.java 10KB
TrainClassifier.java 10KB
DocumentClassification.java 6KB
TrainTopicModeling.java 6KB
SequenceTagging.java 7KB
webapp
WEB-INF
server-config.wsdd 3KB
serviceimpl
TrainClassifier.xml 388B
TopicModeling.xml 368B
TrainTopicModeling.xml 391B
TrainSequenceTagging.xml 393B
SequenceTagging.xml 370B
DocumentClassification.xml 378B
web.xml 3KB
test
resources
masc_500k_texts(blog10topics).inferencer 142KB
masc_500k_texts(blog10topics)_keys.txt 1KB
masc_500k_texts_word_by_word.model 1.04MB
masc_500k_texts(letters).model 112KB
masc_500k_texts(MaxEnt).classifier 7.04MB
java
org
lappsgrid
mallet
TestSequenceTagging.java 6KB
TestTrainSequenceTagging.java 3KB
TestTrainTopicModeling.java 3KB
TestTopicModeling.java 5KB
TestDocumentClassification.java 6KB
TestTrainClassifier.java 4KB
models
masc_500k_texts_MCMaxEnt.classifier 4.97MB
masc_500k_texts_MaxEnt.classifier 4.97MB
masc_500k_texts_DecisionTree.classifier 321KB
masc_500k_texts_BalancedWinnow.classifier 4.95MB
masc_500k_texts_topic_keys.txt 792B
masc_500k_texts_C45.classifier 47.36MB
masc_500k_texts_NaiveBayesEMT.classifier 4.97MB
masc_500k_texts.classifier 4.97MB
masc_500k_texts_NaiveBayes.classifier 4.97MB
masc_500k_texts_Winnow.classifier 4.95MB
masc_500k_texts_MaxEntL1.classifier 4.97MB
masc_500k_texts_word_by_word234.model 1.06MB
masc_500k_texts_topics.inferencer 1.05MB
LICENSE 11KB
pom.xml 2KB
README.md 18KB
共 47 条
- 1
资源评论
龙猫美术的世界
- 粉丝: 20
- 资源: 4722
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- C语言-leetcode题解之70-climbing-stairs.c
- C语言-leetcode题解之68-text-justification.c
- C语言-leetcode题解之66-plus-one.c
- C语言-leetcode题解之64-minimum-path-sum.c
- C语言-leetcode题解之63-unique-paths-ii.c
- C语言-leetcode题解之62-unique-paths.c
- C语言-leetcode题解之61-rotate-list.c
- C语言-leetcode题解之59-spiral-matrix-ii.c
- C语言-leetcode题解之58-length-of-last-word.c
- 计算机编程课程设计基础教程
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功