没有合适的资源？快使用搜索试试~ 我知道了~

文库首页开发技术其它FoolNLTK：中国自然语言工具包

FoolNLTK：中国自然语言工具包

共58个文件

py：25个

sh：9个

txt：6个

Python

需积分: 50 0 下载量 77 浏览量 2021-02-23 03:53:21 上传评论收藏 58.12MB ZIP 举报

温馨提示

傻瓜NLTK 中文文字处理工具包特征尽管不是最快的，但FoolNLTK可能是市场上最准确的开源中文分词器根据训练分词，词性标注，实体识别的高精度用户定义的字典自我训练模型的能力允许批处理入门 *** 2020/2/16 ***更新：使用伯特模型火车和出口模型进行部署，要下载并构建FoolNLTK，请输入： get clone https://github.com/rockyzhengwu/FoolNLTK.git cd FoolNLTK/train 有关详细仅在Linux Python 3环境中测试。安装 pip install foolnltk 使用说明对于分词： import fool text = "一个傻子在北京" print(fool.cut(text)) # ['一个', '傻子', '在', '北京'] 对于分词细分，请指定-b参数以增加每次运行

资源推荐

资源详情

资源评论

（含源码及报告）本程序分析了自2016年到2021年（外加）每年我国原油加工的产量，并且分析了2020年全国各地区原油加工量等，含饼状图，柱状图，折线图，数据在地图上显示。运行本程序需要requests、bs4、csv、pandas、matplotlib、pyecharts库的支持，如果缺少某库请自行安装后再运行。文件含6个excel表，若干个csv文件以及一个名字为render的html文件（需

收起资源包目录

FoolNLTK-master.zip （58个子文件）

FoolNLTK-master

.gitmodules 79B

train

bert_predict.py 4KB

train_bert.sh 268B

load_model.py 280B

prepare_vec.py 2KB

create_map_file.py 2KB

norm_train_recoard.py 9KB

bi_lstm.py 6KB

text_to_tfrecords.py 4KB

main.sh 3KB

__init__.py 41B

tf_metrics.py 8KB

train_bert_ner.py 24KB

decode.py 1KB

data_utils.py 7KB

word2vec.py 1KB

third_party

word2vec

README.txt 1KB

demo-classes.sh 358B

word2vec.c 26KB

demo-word-accuracy.sh 414B

distance.c 4KB

demo-train-big-model-v1.sh 5KB

demo-analogy.sh 631B

word2phrase.c 9KB

LICENSE 11KB

demo-phrase-accuracy.sh 885B

makefile 718B

word-analogy.c 5KB

compute-accuracy.c 5KB

.gitignore 59B

demo-word.sh 272B

demo-phrases.sh 853B

export_model.py 4KB

README.md 3KB

datasets

demo

test.txt 52KB

train.txt 192KB

dev.txt 51KB

data

map.zip 1.19MB

ner.pb 3.27MB

pos.pb 54.77MB

seg.pb 3.26MB

test

test_dict.txt 103B

dictonary.py 577B

__init__.py 41B

loadmodel.py 290B

bert

LICENSE 11KB

README_CH.md 2KB

requirements.txt 31B

setup.py 527B

.gitignore 1KB

fool

predictor.py 3KB

dictionary.py 1KB

trie.py 4KB

__main__.py 2KB

lexical.py 4KB

__init__.py 3KB

model.py 3KB

README.md 2KB

共 58 条

评论收藏

内容反馈

资源评论

资源反馈

评论星级较低，若资源使用遇到问题可联系上传者，3个工作日内问题未解决可申请退款~

米丝梨

粉丝: 25
资源: 4683

上传资源快速赚钱

我的内容管理展开

我的资源快来上传第一个资源

我的收益

登录查看自己的收益

我的积分登录查看自己的积分

我的C币登录后查看C币余额

我的收藏

我的下载

下载帮助

前往需求广场，查看用户热搜

FoolNLTK：中国自然语言工具包

Python-FoolNLTK中文处理工具包号称可能不是最快的开源中文分词

内尔

Python-各大中文分词性能评测

大三用过的一些包做个备份

QA:问答系统

chatrobot.zip

基于Python+pytorch的图像处理+附完整代码图像处理，能够轻松实现图像的读取、显示、裁剪等还有机器学习等操作

python大作业 含爬虫、数据可视化、地图、报告、及源码（2016-2021全国各地区粮食产量）.rar

《点燃我温暖你》中李峋的同款爱心代码

Python金融量化的高级库：TA-Lib-0.4.24（包含python3.7、3.8、3.9、3.10的32位和64位版本）

第十五届蓝桥杯大赛软件赛省赛-PythonB组题目

大麦网抢票脚本【Python脚本】

Python数据分析项目实践，包括数据读取、评估、清洗、分析、可视化机器学习相关内容等

YOLOv8-火焰识别（火焰数据集+代码+GUI界面+内置训练好的模型文件）

人脸识别系统OpenCV+dlib+python（含数据库）Pyqt5界面设计 项目源码 毕业设计

Python教程2020版 完全入门 达到Python工程师水平 笔记+代码+课件+资料

人体姿态检测

Python学习笔记(干货) 中文PDF完整版.pdf

抢购haiwei.rar

Python 八股文.pdf

第十五届蓝桥杯大赛软件赛省赛-PythonA组题目

计算机毕业设计源码：基于python旅游推荐系统+爬虫+分析可视化 +django框架

shape_predictor_68_face_landmarks.zip

python数据分析与可视化

计算机毕业设计：基于python微博舆情分析可视化系统+爬虫+情感分析+Flask框架 项目源码

计算机二级python真题题库（题目+答案）电子版笔记2

爱心代码 李峋同款爱心等免费下载 exe、py、html格式

Tensorflow-gpu版本缺少的dll文件

Microsoft C++ Build Tools

最新资源

python大作业含爬虫、数据可视化、地图、报告、及源码（2016-2021全国各地区粮食产量）.rar

人脸识别系统OpenCV+dlib+python（含数据库）Pyqt5界面设计项目源码毕业设计

Python教程2020版完全入门达到Python工程师水平笔记+代码+课件+资料

计算机毕业设计：基于python微博舆情分析可视化系统+爬虫+情感分析+Flask框架项目源码

爱心代码李峋同款爱心等免费下载 exe、py、html格式