基于Pytorch框架的TPLinker_plus中文命名实体识别python源码+使用说明+模型+数据集.zip

共60个文件

py：26个

pyc：10个

json：8个

版权申诉

毕业设计项目

课程设计

期末大作业

50 浏览量 2024-01-09 19:57:03 上传评论收藏 11.36MB ZIP 举报

1.项目代码均经过功能验证ok，确保稳定可靠运行。欢迎下载体验！下载完使用问题请私信沟通。 2.主要针对各个计算机相关专业，包括计算机科学、信息安全、数据科学与大数据技术、人工智能、通信、物联网等领域的在校学生、专业教师、企业员工。 3.项目具有丰富的拓展空间，不仅可作为入门进阶，也可直接作为毕设、课程设计、大作业、初期项目立项演示等用途。 4.当然也鼓励大家基于此进行二次开发。在使用过程中，如有问题或建议，请及时沟通。 5.期待你能在项目中找到乐趣和灵感，也欢迎你的分享和反馈！【资源说明】基于Pytorch框架的TPLinker_plus中文命名实体识别python源码+使用说明+模型+数据集.zip 还是和之前其它几种实体识别方式相同的代码模板，这里稍微做了一些修改，主要是在数据加载方面。之前都是预先处理好所有需要的数据保存好，由于tplinker需要更多内存，这里使用DataLoader中的collate_fn对每一批的数据分别进行操作，可以大大减少内存的使用。模型主要是来自这里：[tplinker_plus](https://github.com/Tongjilibo/bert4torch/blob/master/examples/sequence_labeling/task_sequence_labeling_ner_tplinker_plus.py)，需要额外了解的知识有：[基于Conditional Layer Normalization的条件文本生成 - 科学空间|Scientific Spaces](https://spaces.ac.cn/archives/7124)和[将“softmax+交叉熵”推广到多标签分类问题 - 科学空间|Scientific Spaces](https://www.spaces.ac.cn/archives/7359)。实现运行步骤如下： - 1、在raw_data下新建一个process.py将数据处理成mid_data下的格式。 - 2、修改部分参数运行main.py，以进行训练、验证、测试和预测。模型及数据下载地址：链接：https://pan.baidu.com/s/1B-e-MV1lOMQj2ur5MADRww?pwd=he3e 提取码：he3e # 依赖 ``` pytorch==1.6.0 tensorboasX seqeval pytorch-crf==0.7.2 transformers==4.4.0 ``` # 运行在16GB的显存下都只能以batch_size=2进行运行。。。 ```python python main.py \ --bert_dir="model_hub/chinese-bert-wwm-ext/" \ --data_dir="./data/cner/" \ --log_dir="./logs/" \ --output_dir="./checkpoints/" \ --num_tags=8 \ --seed=123 \ --gpu_ids="0" \ --max_seq_len=150 \ --lr=3e-5 \ --other_lr=3e-4 \ --train_batch_size=2 \ --train_epochs=1 \ --eval_batch_size=8 \ --max_grad_norm=1 \ --warmup_proportion=0.1 \ --adam_epsilon=1e-8 \ --weight_decay=0.01 \ --dropout_prob=0.3 \ ``` ### 结果 ```python precision:0.8806 recall:0.8999 micro_f1:0.8901 precision recall f1-score support TITLE 0.87 0.88 0.87 767 RACE 0.88 0.93 0.90 15 CONT 1.00 1.00 1.00 33 ORG 0.89 0.90 0.89 543 NAME 0.99 1.00 1.00 110 EDU 0.82 0.94 0.88 109 PRO 0.67 0.95 0.78 19

资源推荐

资源详情

资源评论

收起资源包目录

基于Pytorch框架的TPLinker_plus中文命名实体识别python源码+使用说明+模型+数据集.zip （60个子文件）

课程作业提交源码-最终版本

__init__.py 0B

preprocess.py 2KB

model_hub

占位.txt 0B

main.py 12KB

data

cner

raw_data

__init__.py 0B

process.py 4KB

train.char.bmes 1.04MB

dev.char.bmes 117KB

test.char.bmes 132KB

mid_data

test.json 135KB

train.json 1.07MB

labels.json 61B

dev.json 122KB

utils

__init__.py 0B

metric_utils.py 2KB

cut_sentence.py 4KB

train_utils.py 4KB

__pycache__

metric_utils.cpython-37.pyc 2KB

train_utils.cpython-37.pyc 4KB

common_utils.cpython-37.pyc 5KB

__init__.cpython-37.pyc 145B

cut_sentence.cpython-37.pyc 3KB

common_utils.py 5KB

data_loader.py 4KB

tplinker_plus.py 9KB

使用说明.md 3KB

logs

bert.log 245KB

checkpoints

占位.txt 0B

config.py 2KB

__init__.py 0B

pytorch_bert_bilstm_crf_ner-main.zip 9.81MB

preprocess.py 2KB

model_hub

ռλ.txt 0B

main.py 12KB

data

cner

raw_data

__init__.py 0B

process.py 4KB

train.char.bmes 1.04MB

dev.char.bmes 117KB

test.char.bmes 132KB

mid_data

test.json 135KB

train.json 1.07MB

labels.json 61B

dev.json 122KB

utils

__init__.py 0B

metric_utils.py 2KB

cut_sentence.py 4KB

train_utils.py 4KB

__pycache__

metric_utils.cpython-37.pyc 2KB

train_utils.cpython-37.pyc 4KB

common_utils.cpython-37.pyc 5KB

__init__.cpython-37.pyc 145B

cut_sentence.cpython-37.pyc 3KB

common_utils.py 5KB

data_loader.py 4KB

课程作业提交源码-最终版本.zip 531KB

tplinker_plus.py 9KB

使用说明.md 3KB

logs

bert.log 245KB

checkpoints

ռλ.txt 0B

config.py 2KB

评论收藏

内容反馈

版权申诉

北航程序员小C

粉丝: 2222
资源: 1823

基于Pytorch框架的TPLinker_plus中文命名实体识别python源码+使用说明+模型+数据集.zip

基于pytorch的bert-bilstm-crf中文命名实体识别项目源码+文档说明.zip

基于Pytorch框架+GlobalPointer实现中文命名实体识别python源码+使用说明+模型+数据集.zip

基于pytorch的one vs rest中文命名实体识别python源码+使用说明+模型+数据集.zip

基于Pytorch框架的多头选择方法实现中文命名实体识别python源码+使用说明+模型+数据集.zip

Python基于Pytorch框架Bert+BiLSTM算法实现的中文命名实体识别源码+数据集(毕设项目).zip

基于Pytorch框架的级联Bert中文命名实体识别源码+使用说明+训练好的模型.zip

Pytorch框架基于Bert模型的CoNLL-2003命名实体识别python源码+使用说明(操作简单).zip

毕设项目-基于Pytorch框架和神经网络的垃圾识别分类python源码+超详细注释.zip

基于pytorch的医疗命名实体识别项目源码.zip

基于Pytorch机器阅读理解bert_mrc的命名实体识别源码+使用说明+模型+数据.zip

基于Pytorch+BI-LSTM+CRF的中文命名实体识别Python源码+文档说明

论文复现基于pytorch框架与transformer同时实现问题答案生成python源码+运行说明.zip

基于BERT-BILSTM-CRF进行中文命名实体识别python源码+项目使用说明+数据+模型.zip

Pytorch框架基于BERT-BILSTM-CRF实现的中文命名实体识别python源码+详细项目说明.zip

Pytorch框架基于Bert构建词向量+Bi-LSTM+Attention实现情感分类任务python源码+数据集.zip

基于Pytorch框架图像分割的红外弱小目标检测Python源码+数据集+模型+使用说明.zip

基于Pytorch实现BERT-of-Theseus模型压缩源码+使用说明+数据.zip

基于Python和PyTorch框架完成的一个手写数字识别实验源码(带MNIST手写数字数据集).zip

基于Pytorch的命名实体识别-信息抽取python源码(支持中英文数据+LSTM+CRF等多种模型)+数据集.zip

《点燃我温暖你》中李峋的同款爱心代码

122版本Chrome最新驱动-122.0.6261.58

第十五届蓝桥杯大赛软件赛省赛-PythonB组题目

Python入门基础教程全套.ppt

Stable Diffusion WebUI linux部署问题

Tesseract最新中文语言包chi-sim.traineddata

第十五届蓝桥杯大赛软件赛省赛-PythonA组题目

PyCharm安装教程一篇搞定包括下载PyCharm、安装PyCharm、PyCharm简单使用教程

Python学习笔记(干货) 中文PDF完整版.pdf

谷歌浏览器驱动最新版(123.0.6312.122)

最新资源