没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
NLP工具 本项目初步通过Tensorflow基于BiLSTM + CRF实现字符级序列标注模型。 功能: 1,对未登录字(词)识别能力 2,Http接口 3,可快速实现分词,词性标注,NER,SRL等序列标注模型 欢迎各位大佬吐槽。 说明 环境配置:创建新的conda环境 $ conda env create -f environment.yaml 语料处理 不同标注语料格式不同,需要额外处理,在示例/DataPreprocessing.ipynb中提供了人民日报2014准备过程(该语料集未上传至github,只有部分样例于corpus,可通过互联网找到。若发现可发邮件给我),语料格式:
资源推荐
资源详情
资源评论
收起资源包目录
NLP-tools-master.zip (14个子文件)
NLP-tools-master
.gitignore 17B
app.py 536B
README.md 2KB
Model test.ipynb 5KB
train.py 6KB
cws
model.py 4KB
data.py 3KB
segmenter.py 4KB
corpus
c1002-23996898.txt 5KB
c1002-23995935.txt 2KB
example
sentence.py 2KB
Data Preprocessing.ipynb 14KB
data
your_dict.pkl 26KB
your_train_data.pkl 64KB
共 14 条
- 1
资源评论
- 陈熙昊2023-07-26使用该工具我能够准确地对中文文本进行分词处理,节省了很多时间和精力。
- 蔓誅裟華2023-07-26我使用这个工具进行实验时,发现它的词性标注功能非常稳定,可以准确地标注出不同词性的单词。
- 宝贝的麻麻2023-07-26这份文件提供了一种简洁而有效的方法,帮助我进行中文文本的命名实体识别,能够准确地识别出人名、地名等实体信息。
- thebestuzi2023-07-26这份文件提供了一个方便的工具,帮助我们实现了中文分词、词性标注和命名实体识别,非常实用。
- 创业青年骁哥2023-07-26这个项目的模型基于BiLSTM和CRF,效果还不错,对于处理中文文本有很高的准确率。
流浪的夏先森
- 粉丝: 22
- 资源: 4688
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功