Python-用于预先练训的BERT和其他变压器的spaCy管道资源-CSDN文库

共371个文件

pyi：330个

py：32个

flake8：1个

需积分: 10 113 浏览量 2019-08-12 04:27:59 上传评论收藏 270KB ZIP 举报

**Python预训练模型在自然语言处理中的应用** 在自然语言处理（NLP）领域，预训练模型已经成为理解和处理人类语言的关键工具。其中，BERT（Bidirectional Encoder Representations from Transformers）模型由Google在2018年提出，它通过在大规模无标注文本数据上进行预训练，实现了对语境的深度理解，从而在多个NLP任务中取得了前所未有的性能。spaCy是一个流行的Python库，它提供了高效的自然语言处理工具，包括词性标注、实体识别、依存关系解析等。现在，spaCy已经集成了对预训练模型如BERT的支持，使得开发者能够轻松地在spaCy管道中应用这些先进的NLP技术。 **spaCy管道与预训练模型** spaCy的管道是一个序列化的工作流程，可以处理一系列的NLP任务。传统的spaCy管道通常包括分词器、词性标注器、实体识别器等组件。通过引入预训练的Transformer模型，如BERT，spaCy可以实现更复杂的语义理解任务，如情感分析、文本分类、问答系统等。这样的集成使得用户可以在spaCy的简单API下利用强大的预训练模型，无需深入理解Transformer的内部机制。 **爆炸性增长的pytorch-transformers** "explosion-spacy-pytorch-transformers-e0d481e"这个文件名可能指的是 Explosion 的 spacy-pytorch-transformers 库的一个特定版本。Explosion是一家专注于NLP工具开发的公司，他们的spacy-pytorch-transformers项目旨在将Hugging Face的pytorch-transformers库（现在称为transformers）与spaCy相结合，提供一个统一的接口来使用基于PyTorch的预训练模型。 **pytorch-transformers与Transformer模型** pytorch-transformers是Hugging Face团队开发的库，包含了多种Transformer模型，如BERT、GPT-2、DistilBERT等。这些模型都是基于Transformer架构，该架构由Vaswani等人在2017年的论文《Attention is All You Need》中提出，它使用自注意力机制解决了传统RNN和LSTM模型的序列依赖问题，极大地提高了并行计算效率。 **整合过程** 在spaCy中使用预训练的Transformer模型通常涉及以下步骤： 1. 安装必要的库：你需要安装spaCy、pytorch-transformers（或transformers）以及相应的模型库。 2. 加载模型：通过spaCy的`nlp.create_pipe`方法加载预训练模型，例如`nlp.add_pipe('transformer', config={'model_name': 'bert-base-chinese'})`加载预训练的BERT模型。 3. 配置和训练：根据具体任务调整模型参数，并可能进行微调以适应特定的数据集。 4. 应用模型：将模型添加到spaCy的处理管道中，与其他NLP任务一起运行。 **总结** Python-用于预先训练的BERT和其他Transformer的spaCy管道展示了如何将最先进的NLP模型融入到spaCy的简单工作流中，使得开发者能快速、高效地应用这些模型解决实际问题。通过结合pytorch-transformers，我们可以方便地利用预训练的Transformer模型，如BERT，来提升自然语言处理任务的性能，例如文本分类、情感分析、实体识别等。这种融合为Python开发人员在自然语言处理领域提供了强大且易于使用的工具。

资源推荐

资源详情

资源评论

收起资源包目录

Python-用于预先练训的BERT和其他变压器的spaCy管道（371个子文件）

glue.conf 1004B

.coveragerc 462B

.flake8 139B

.gitignore 2KB

LICENSE 1KB

README.md 32KB

model_registry.py 11KB

wordpiecer.py 10KB

tok2vec.py 10KB

_tokenizers.py 10KB

language.py 9KB

glue_tasks.py 8KB

run_glue.py 7KB

train_textcat.py 7KB

util.py 7KB

wrapper.py 7KB

test_util.py 4KB

activations.py 4KB

test_wordpiece_alignment.py 3KB

test_tok2vec.py 3KB

test_language.py 3KB

setup.py 3KB

test_activations.py 2KB

textcat.py 2KB

test_model_registry.py 2KB

test_wordpiecer.py 2KB

test_textcat.py 2KB

init_model.py 1KB

test_extensions.py 1KB

test_wrapper.py 879B

hyper_params.py 745B

conftest.py 638B

__init__.py 360B

util.py 323B

about.py 252B

__init__.py 148B

__init__.py 0B

__init__.pyi 14KB

functional.pyi 12KB

modeling_bert.pyi 8KB

modeling_transfo_xl.pyi 8KB

symbolic.pyi 8KB

modeling_xlnet.pyi 7KB

modeling_xlm.pyi 6KB

wrappers.pyi 6KB

loss.pyi 6KB

__init__.pyi 5KB

pooling.pyi 5KB

activation.pyi 5KB

modeling_openai.pyi 5KB

modeling_gpt2.pyi 4KB

rnn.pyi 4KB

__init__.pyi 4KB

tokenization_transfo_xl.pyi 4KB

modeling_utils.pyi 4KB

lr_scheduler.pyi 4KB

frontend.pyi 4KB

profiler.pyi 3KB

transforms.pyi 3KB

conv.pyi 3KB

tensor.pyi 3KB

distributed_c10d.pyi 3KB

__init__.pyi 3KB

container.pyi 3KB

__init__.pyi 3KB

constraints.pyi 3KB

tokenization_utils.pyi 3KB

model.pyi 2KB

__init__.pyi 2KB

functional.pyi 2KB

module.pyi 2KB

cpp_extension.pyi 2KB

sparse.pyi 2KB

decorators.pyi 2KB

tokenization_bert.pyi 2KB

__init__.pyi 2KB

padding.pyi 2KB

function.pyi 2KB

dataloader.pyi 2KB

quantized.pyi 2KB

normalization.pyi 2KB

api.pyi 2KB

describe.pyi 1KB

rnn.pyi 1KB

sampler.pyi 1KB

collect_env.pyi 1KB

relaxed_categorical.pyi 1KB

spectral_norm.pyi 1KB

reductions.pyi 1KB

distribution.pyi 1KB

relaxed_bernoulli.pyi 1KB

tokenization_xlnet.pyi 1KB

batchnorm.pyi 1KB

kl.pyi 1KB

distributed.pyi 1KB

_jit_internal.pyi 1KB

optimization.pyi 1KB

共 371 条

评论收藏

内容反馈

weixin_39840650

粉丝: 413
资源: 1万+

Python-用于预先练训的BERT和其他变压器的spaCy管道

BioBERT：一种经过预先训练的生物医学语言表示模型-Python开发

Python-BioBERT用于生物医学文本挖掘的预先训练生物医学语言表示模型

Python-用谷歌BERT模型在BLSTMCRF模型上进行预训练用于中文命名实体识别的Tensorflow代码

Python-基于TensorFlow和BERT的管道式实体及关系抽取

Python-Google官方发布BERT的TensorFlow代码和预训练模型

课程设计-基于预训练模型BERT的阅读理解python源码+使用说明.zip

Python-微调BERT用于提取摘要的论文代码

spacy-sentence-bert:用于SpaCy的句子转换器模型

Python-公开可用的临床BERT嵌入Repository

Python-通过构建辅助句子利用BERT进行情感分析的论文代码和语料库

Python-使用预训练语言模型BERT做中文NER

biobert-pytorch:BioBERT的PyTorch实施

biobert:生物BERT

bert-base-uncased 预训练模型

biobert-master.zip

biobert_v1.1_pubmed.tar.gz

spaCy-and-Bert-for-Traffic-Incident

bert-base-chinese.rar

pytorch-pretrained-BERT-master_python_bert问答_BERT_

Python-本实验是用BERT进行中文情感分类记录了详细操作及完整程序

Python-BERT生成句向量BERT做文本分类文本相似度计算

Python-BERT模型从训练到部署全流程

Python-简单高效的Bert中文文本分类模型开发和部署

Python-简洁方便获取BERT嵌入表示MXNetgluonnlp

Python-OpenAssistant是一个不断开发的开源人工智能

Python-在Keras下微调Bert的一些例子

基于bert的文本情感分析

自然语言处理-bert-base-chinese模型

最新资源