nlp-tutorial-master.zip


-
自然语言处理分块教程代码主要包含: NNLM,Word2Vec,FastText,TextCNN,TextRNN,TextLSTM,Bi-LSTM,Seq2Seq, Seq2Seq(Attention),Bi-LSTM(Attention),Transformer,BERT 基本没报错,是自用教程,觉得很好用所以分享一下哈
- NLP 利器 Gensim 库的使用之 Word2Vec 模型案例演示(基于 word2vec-google-news-300 预训练模型,附下载) 21892020-05-30Gensim 库的使用之 Word2Vec 模型案例演示 要见识一下 Word2Vec 模型可以做什么,那么最好的方法就是直接下载一个预训练模型,然后尝试用一下看看效果。 我们在这里获取一个在 Google News 数据集上训练完成的 Word2Vec 模型,覆盖了大约 300 万的词汇和短语。 这样一个模型需要几个小时来进行训练,但是既然 Google 已经将其公开,那直接花几分钟下载下来就能用了。 !!!注意:该模型大小约 2GB,而且需要科学的方法才能下载!实在无法解决网络问题的朋友,可以用我提供的
202KB
自然语言处理中一些模型的实现
2019-03-04nlp-tutorial-master.zip自然语言处理中一些模型的实现
32B
GoogleNews-vectors-negative300.bin.gz
2019-07-20GoogleNews-vectors-negative300.bin.gz是word2vec提前训练好的model。
614.39MB
GoogleNews-vectors-negative300.bin 压缩包1/3
2018-05-30KeyedVectors.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True)
62.27MB
zhwiki-20200720-pages-articles-multistream5.xml-p4271087p4731439.bz2
2020-07-27维基百科中文语料库,是自然语言处理中常用的一个数据集,里面包含了大量的中文词条,本文件是2020年7月份最新的语料(部分)。
6.16MB
Bert-Chinese-Text-Classification-Pytorch-master.zip.zip
2007-04-04完整的bert模型源代码,对代码做了很多注释和精简,以中文文本分类为例的一个deom,可以拿来就用,把代码稍微改改就可用在你的任务中。
196KB
nlp-tutorial.zip
2020-04-16Nlp 入门tutorial 最好学的tutorial,包括 Embedding Model、Attention、CNN、RNN、Transformer、Bert Pytorch框架,超级简单,适合入门
1.94MB
JPype1-0.6.3-cp37-cp37m-win_amd64.whl+hanlp1.7.5.jar.zip
2019-11-07NLP常用的工具包:Hanlp必备: 步骤为: 1.Hanlp环境安装》》• 1、安装Java:1.8以上;• 2、安裝Jpype,用提供的Jpype 0.6.3.whl可直接Pip!!!(上传的为win64,py3.7) 2.Hanlp安装》》• 1、下载hanlp.jar包(已提供1.7.5版)• 2、下载data.zip(data-for-1.7.5到https://github.com/hankcs/HanLP/链接中下载) • 3、将jar和data解压后放到同一文件夹下(最终能看到data文件夹和hanlp-1.7.5.jar、hanlp-1.7.5-sources.jar、hanlp.properties!),然后配置jar解压后的文件:hanlp.properties,告诉HanLP数据包的位置,只需修改第一行:root=****(这里放你前面解压的绝对路径!)
166.24MB
zhwiki-20200720-pages-articles1.xml-p1p162886.bz2
2020-07-28维基百科中文语料库,是自然语言处理中常用的一个数据集,里面包含了大量的中文词条,本文件是2020年7月份最新的语料(1)。
68B
GoogleNews-vectors-negative300网盘下载地址.txt
2020-02-29GoogleNews-vectors-negative300.bin.gz百度网盘下载地址 GoogleNews-vectors-negative300.bin.gz百度网盘下载地址
614.39MB
GoogleNews-vectors-negative300.bin 压缩包2/3
2018-05-30KeyedVectors.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True)
180.0MB
word2vec-google-news-300.zip.008
2020-05-30Word2Vec 模型word2vec-google-news-300。在 Google News 数据集上训练完成的 Word2Vec 模型,覆盖了大约 300 万的词汇和短语。该模型是利用了整个 Google News 大约 1000 亿个词的语料训练而成!由于文件太大,将压缩包分成了10个部分。
2.23MB
nlp-lang-1.7.jar
2017-09-04ansj是由孙健开发的一个基于n-Gram+CRF+HMM的中文分词的java实现。分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上。目前实现了:中文分词、中文姓名识别、用户自定义词典、关键字提取、自动摘要、关键字标记等功能。可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目。作者在最新的分词方式里增加了基于深度学习的分词方式。
202.99MB
zhwiki-20200720-pages-articles2.xml-p162887p544644.bz2
2020-07-28维基百科中文语料库,是自然语言处理中常用的一个数据集,里面包含了大量的中文词条,本文件是2020年7月份最新的语料(2)。
637.69MB
data-for-1.7.5.zip
2020-08-14NLP错误解决方案文件,大家有问题可以到我的博客去查看,欢迎赐教
265.99MB
zhwiki-20200720-pages-articles3.xml-p544645p1154617.bz2
2020-07-29维基百科中文语料库,是自然语言处理中常用的一个数据集,里面包含了大量的中文词条,本文件是2020年7月份最新的语料(3)
560B
自然语言处理--节日时间词.txt
2021-03-26自然语言处理--节日时间词.txt
617KB
自然语言处理--反义关系库.txt
2021-03-26自然语言处理--反义关系库.txt
63.56MB
tensorflow-1.14.0-cp36-cp36m-win_amd64.zip
2019-09-12tensorflow-1.14.0-cp36-cp36m-win_amd64
478KB
BERT-BiLSTM-CRF-NER-master.zip
2020-08-09BERT只是一个预训练的语言模型,在各大任务上都刷新了榜单。我们本次实验的任务也是一个序列标注问题,简而言之,就是是基于BERT预训练模型,在中文NER(Named Entity Recognition,命名实体识别)任务上进行fine-tune。 Fine-tune是什么意思,中文译为微调。在transfer learning中,对事先训练好的特征抽取网络,直接拿来用在下游任务上。固定其特征抽取层的网络参数,只在原有的网络上增加少量神经元,做最后的分类任务,而且只更新分类参数。
-
下载
bmp位图转PCB文件工具 1.0绿色免费版.exe
bmp位图转PCB文件工具 1.0绿色免费版.exe
-
下载
第五章_WY.ppsx
第五章_WY.ppsx
-
下载
ad图层pcb画图.txt
ad图层pcb画图.txt
-
下载
Zuken CR5000入门教程.rar
Zuken CR5000入门教程.rar
-
下载
RTS5732DLQ_B17A.zip
RTS5732DLQ_B17A.zip
-
下载
智慧楼宇综合安防平台解决方案.pptx
智慧楼宇综合安防平台解决方案.pptx
-
下载
【64位】【全键】桌面猫咪.zip
【64位】【全键】桌面猫咪.zip
-
下载
text-rank.zip
text-rank.zip
-
下载
T_D_OD_WDFXZLVBDZL.sql
T_D_OD_WDFXZLVBDZL.sql
-
下载
Edison(爱迪生)电子学实验软件v4.0版.exe.baiduyun.p.downloading
Edison(爱迪生)电子学实验软件v4.0版.exe.baiduyun.p.downloading
