没有合适的资源?快使用搜索试试~ 我知道了~
FoolNLTK:中国自然语言工具包
共58个文件
py:25个
sh:9个
txt:6个
需积分: 50 0 下载量 77 浏览量
2021-02-23
03:53:21
上传
评论
收藏 58.12MB ZIP 举报
温馨提示
傻瓜NLTK 中文文字处理工具包 特征 尽管不是最快的,但FoolNLTK可能是市场上最准确的开源中文分词器 根据训练 分词,词性标注,实体识别的高精度 用户定义的字典 自我训练模型的能力 允许批处理 入门 *** 2020/2/16 ***更新:使用伯特模型火车和出口模型进行部署, 要下载并构建FoolNLTK,请输入: get clone https://github.com/rockyzhengwu/FoolNLTK.git cd FoolNLTK/train 有关详细 仅在Linux Python 3环境中测试。 安装 pip install foolnltk 使用说明 对于分词: import fool text = "一个傻子在北京" print(fool.cut(text)) # ['一个', '傻子', '在', '北京'] 对于分词细分,请指定-b参数以增加每次运行
资源推荐
资源详情
资源评论
收起资源包目录
FoolNLTK-master.zip (58个子文件)
FoolNLTK-master
.gitmodules 79B
train
bert_predict.py 4KB
train_bert.sh 268B
load_model.py 280B
prepare_vec.py 2KB
create_map_file.py 2KB
norm_train_recoard.py 9KB
bi_lstm.py 6KB
text_to_tfrecords.py 4KB
main.sh 3KB
__init__.py 41B
tf_metrics.py 8KB
train_bert_ner.py 24KB
decode.py 1KB
data_utils.py 7KB
word2vec.py 1KB
third_party
word2vec
README.txt 1KB
demo-classes.sh 358B
word2vec.c 26KB
demo-word-accuracy.sh 414B
distance.c 4KB
demo-train-big-model-v1.sh 5KB
demo-analogy.sh 631B
word2phrase.c 9KB
LICENSE 11KB
demo-phrase-accuracy.sh 885B
makefile 718B
word-analogy.c 5KB
compute-accuracy.c 5KB
.gitignore 59B
demo-word.sh 272B
demo-phrases.sh 853B
export_model.py 4KB
README.md 3KB
datasets
demo
test.txt 52KB
train.txt 192KB
dev.txt 51KB
data
map.zip 1.19MB
ner.pb 3.27MB
pos.pb 54.77MB
seg.pb 3.26MB
test
test_dict.txt 103B
dictonary.py 577B
__init__.py 41B
loadmodel.py 290B
bert
LICENSE 11KB
README_CH.md 2KB
requirements.txt 31B
setup.py 527B
.gitignore 1KB
fool
predictor.py 3KB
dictionary.py 1KB
trie.py 4KB
__main__.py 2KB
lexical.py 4KB
__init__.py 3KB
model.py 3KB
README.md 2KB
共 58 条
- 1
资源评论
米丝梨
- 粉丝: 25
- 资源: 4683
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功