没有合适的资源?快使用搜索试试~ 我知道了~
PyShortTextCategorization:用于短文本挖掘的各种算法
共119个文件
py:70个
rst:24个
txt:5个
需积分: 10 0 下载量 48 浏览量
2021-01-30
03:16:13
上传
评论
收藏 456KB ZIP 举报
温馨提示
Python中的短文本挖掘 介绍 此程序包shorttext是一个Python程序包,可促进对短文本分类进行有监督和无监督的学习。 由于单词的稀疏性以及短文本本身携带的信息不足,在将文本和文档放入任何分类算法之前,需要对文本和文档进行中间表示。 在此程序包中,它促进了这些表示形式的各种类型,包括主题建模和词嵌入算法。 从1.2.4版开始,它可以在Python 3.8上运行。 从1.2.3版开始,不再支持Python 3.5。 从1.1.7版开始,不再支持Python 2.7。 从1.0.8版开始,它就可以在Python 3.7上运行,并且'TensorFlow'是keras的后端。 从1.0.7版开始,它也可以在Python 3.7上运行,但是keras的后端不能是TensorFlow 。 从1.0.0版开始, shorttext可在Python shorttext和3.6上运行。 特点: 提供的示例数据(包括主题关键字和NIH报告); 文本预处理; 预训练的词嵌入支持; gensim主题模型(LDA,LSI,随机投影)和自动编码器; 支持主题模型表示,以使用scikit
资源推荐
资源详情
资源评论
收起资源包目录
PyShortTextCategorization:用于短文本挖掘的各种算法 (119个子文件)
dldist.c 825KB
lcp.c 197KB
edits1_comb.c 140KB
setup.cfg 119B
shorttext_exampledata.csv 1KB
.gitignore 14KB
MANIFEST.in 468B
LICENSE 1KB
Makefile 7KB
README.md 8KB
nnlib_clstm.png 86KB
nnlib_cnn.png 55KB
SkLearnClassification.py 17KB
GensimTopicModeling.py 13KB
stacking.py 11KB
VarNNEmbedVecClassification.py 11KB
MaxEntClassification.py 10KB
frameworks.py 9KB
VarNNSumEmbedVecClassification.py 9KB
AutoEncodingTopicModeling.py 9KB
conf.py 9KB
TopicVectorDistanceClassification.py 9KB
compactmodel_io.py 9KB
sakaguchi.py 8KB
binarize.py 8KB
data_retrieval.py 8KB
s2skeras.py 8KB
charbaseS2S.py 8KB
dtm.py 8KB
wordembed.py 7KB
SumEmbedVecClassification.py 6KB
transformers.py 6KB
test_stacking.py 6KB
LatentTopicModeling.py 5KB
bertscore.py 5KB
test_var_nn_embedded_vec_classifier.py 4KB
wordmoverdist.py 4KB
char2vec.py 4KB
setup.py 4KB
gensim_corpora.py 3KB
smartload.py 3KB
jaccard.py 3KB
textpreprocessing.py 3KB
frameworks.py 2KB
norvig.py 2KB
test_fuzzylogic.py 2KB
test_bertrepresentations.py 2KB
jaccard.py 2KB
test_dtm.py 2KB
test_sakaguchispell.py 1KB
test_wmd.py 1KB
misc.py 1KB
kerasmodel_io.py 1KB
__init__.py 1KB
classification_exceptions.py 1KB
basespellcorrector.py 752B
__init__.py 664B
test_charonehot.py 610B
test_norvigspell.py 577B
__init__.py 572B
__init__.py 556B
deprecation.py 526B
test_textpreprocessing.py 508B
editor.py 215B
__init__.py 200B
__init__.py 182B
__init__.py 159B
__init__.py 155B
__init__.py 109B
__init__.py 109B
__init__.py 101B
__init__.py 84B
__init__.py 76B
__init__.py 74B
__init__.py 66B
__init__.py 61B
__init__.py 50B
__init__.py 40B
__init__.py 40B
__init__.py 35B
__init__.py 34B
__init__.py 25B
dldist.pyx 955B
edits1_comb.pyx 602B
lcp.pyx 330B
tutorial_topic.rst 13KB
news.rst 12KB
refs.rst 8KB
tutorial_nnlib.rst 8KB
tutorial_metrics.rst 7KB
tutorial_wordembed.rst 7KB
tutorial_dataprep.rst 4KB
tutorial_stacking.rst 4KB
tutorial_textpreprocessing.rst 4KB
links.rst 3KB
tutorial_sumvec.rst 3KB
tutorial_dtm.rst 3KB
tutorial_charbaseseq2seq.rst 3KB
install.rst 3KB
tutorial_maxent.rst 3KB
共 119 条
- 1
- 2
资源评论
李凜之
- 粉丝: 36
- 资源: 4602
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功