<center>
<img style="border-radius: 0.3125em;
box-shadow: 0 2px 4px 0 rgba(34,36,38,.12),0 2px 10px 0 rgba(34,36,38,.08);"
src="./data/.logo图片/.img.jpg"width="180">
<br>
<div style="color:orange; border-bottom: 1px solid #d9d9d9;
display: inline-block;
color: #999;
padding: 2px;">NLP民工的乐园</div>
</center>
<br>
[![](https://img.shields.io/github/stars/fighting41love/funnlp?style=social)](https://github.com/fighting41love/funnlp)
[![](https://img.shields.io/badge/dynamic/json?color=blue&label=%E7%9F%A5%E4%B9%8E%E5%85%B3%E6%B3%A8&query=%24.data.totalSubs&url=https%3A%2F%2Fapi.spencerwoo.com%2Fsubstats%2F%3Fsource%3Dzhihu%26queryKey%3Dmountain-blue-64)](https://www.zhihu.com/people/mountain-blue-64)
[![](data/.logo图片/.捐赠图片/.Citations-487-red.svg)](https://scholar.google.com/citations?hl=en&user=aqZdfDUAAAAJ)
[![](data/.logo图片/.捐赠图片/.Home-%E4%BA%BA%E7%94%9F%E6%B5%AA%E8%B4%B9%E6%8C%87%E5%8D%97-brightgreen.svg)](http://fighting41love.github.io/archives/)
[![](data/.logo图片/.捐赠图片/.%E7%8C%8E%E9%80%81%E9%97%A8-CV-orange.svg)](http://fighting41love.github.io/)
<!-- [![](https://img.shields.io/badge/dynamic/json?color=blueviolet&label=github%20followers&query=%24.data.totalSubs&url=https%3A%2F%2Fapi.spencerwoo.com%2Fsubstats%2F%3Fsource%3Dgithub%26queryKey%3Dfighting41love)](https://github.com/fighting41love) -->
<!-- [![](https://img.shields.io/badge/Homepage-%E4%BA%BA%E7%94%9F%E6%B5%AA%E8%B4%B9%E6%8C%87%E5%8D%97-brightgreen)](http://fighting41love.github.io/archives/) -->
### The Most Powerful NLP-Weapon Arsenal
## NLP民工的乐园: 几乎最全的中文NLP资源库
在入门到熟悉NLP的过程中,用到了很多github上的包,遂整理了一下,分享在这里。
很多包非常有趣,值得收藏,满足大家的收集癖!
如果觉得有用,请分享并star:star:,谢谢!
长期不定时更新,欢迎watch和fork!:heart::heart::heart:
| :fire::fire::fire::fire::fire::fire::fire::fire::fire::fire: |
| ---- |
| * [类ChatGPT的模型评测对比](#类ChatGPT的模型评测对比) <br> * [类ChatGPT的资料](#类ChatGPT的资料) <br>* [类ChatGPT的开源框架](#类ChatGPT的开源框架) <br>* [LLM的训练_推理_低资源_高效训练](#LLM的训练_推理_低资源_高效训练) <br>* [提示工程](#提示工程) <br>* [类ChatGPT的文档问答](#类ChatGPT的文档问答) <br>* [类ChatGPT的行业应用](#类ChatGPT的行业应用) <br>* [类ChatGPT的课程资料](#类ChatGPT的课程资料) <br>* [LLM的安全问题](#LLM的安全问题) <br>* [多模态LLM](#多模态LLM) <br>* [LLM的数据集](#LLM的数据集)
| :eggplant: :cherries: :pear: :tangerine: | :sunflower: :strawberry: :melon: :tomato: :pineapple: |
| ---- | ---- |
| * [语料库](#语料库) <br> * [词库及词法工具](#词库及词法工具) <br> * [预训练语言模型](#预训练语言模型) <br> * [抽取](#抽取) <br> * [知识图谱](#知识图谱) <br> * [文本生成](#文本生成) <br> * [文本摘要](#文本摘要) <br> * [智能问答](#智能问答) <br> * [文本纠错](#文本纠错) | * [文档处理](#文档处理) <br> * [表格处理](#表格处理) <br> * [文本匹配](#文本匹配) <br> * [文本数据增强](#文本数据增强) <br> * [文本检索](#文本检索) <br> * [阅读理解](#阅读理解) <br> * [情感分析](#情感分析) <br> * [常用正则表达式](#常用正则表达式) <br> * [语音处理](#语音处理) |
| * [常用正则表达式](#常用正则表达式) <br> * [事件抽取](#事件抽取) <br> * [机器翻译](#机器翻译) <br> * [数字转换](#数字转换) <br> * [指代消解](#指代消解) <br> * [文本聚类](#文本聚类) <br> * [文本分类](#文本分类) <br> * [知识推理](#知识推理) <br> * [可解释NLP](#可解释自然语言处理) <br> * [文本对抗攻击](#文本对抗攻击) | * [文本可视化](#文本可视化) <br> * [文本标注工具](#文本标注工具) <br> * [综合工具](#综合工具) <br> * [有趣搞笑工具](#有趣搞笑工具) <br> * [课程报告面试等](#课程报告面试等) <br> * [比赛](#比赛) <br> * [金融NLP](#金融自然语言处理) <br> * [医疗NLP](#医疗自然语言处理) <br> * [法律NLP](#法律自然语言处理) <br> * [文本生成图像](#文本生成图像) <br> * [其他](#其他) |
<!--
目录(Table of contents)
=================
<table border="0">
<tr>
<td><b style="font-size:30px">:star:</b></td>
<td><b style="font-size:30px">:star::star:</b></td>
<td><b style="font-size:30px">:star::star::star:</b></td>
<td><b style="font-size:30px">:star::star::star::star:</b></td>
</tr>
<tr>
<td>
<!--ts-->
<!-- * [语料库](#语料库)
* [词库及词法工具](#词库及词法工具)
* [预训练语言模型](#预训练语言模型)
* [抽取](#抽取)
* [知识图谱](#知识图谱)
* [文本生成](#文本生成)
* [文本摘要](#文本摘要)
* [智能问答](#智能问答)
* [文本纠错](#文本纠错) -->
<!--te-->
</td>
<td>
<!--ts-->
<!-- * [文档处理](#文档处理)
* [表格处理](#表格处理)
* [文本匹配](#文本匹配)
* [文本数据增强](#文本数据增强)
* [文本检索](#文本检索)
* [阅读理解](#阅读理解)
* [情感分析](#情感分析)
* [常用正则表达式](#常用正则表达式)
* [语音处理](#语音处理) -->
<!--te-->
</td>
<td>
<!--ts-->
<!-- * [常用正则表达式](#常用正则表达式)
* [事件抽取](#事件抽取)
* [机器翻译](#机器翻译)
* [数字转换](#数字转换)
* [指代消解](#指代消解)
* [文本聚类](#文本聚类)
* [文本分类](#文本分类)
* [知识推理](#知识推理)
* [可解释NLP](#可解释自然语言处理)
* [文本对抗攻击](#文本对抗攻击) -->
<!--te-->
</td>
<td>
<!--ts-->
<!--
* [文本可视化](#文本可视化)
* [文本标注工具](#文本标注工具)
* [综合工具](#综合工具)
* [有趣搞笑工具](#有趣搞笑工具)
* [课程报告面试等](#课程报告面试等)
* [比赛](#比赛)
* [金融NLP](#金融自然语言处理)
* [医疗NLP](#医疗自然语言处理)
* [法律NLP](#法律自然语言处理)
* [其他](#其他) -->
<!--te-->
<!-- </td>
</tr>
</table> -->
----
# 类ChatGPT的模型评测对比
| 资源名(Name) | 描述(Description) | 链接 |
| :--- | :---- | :--- |
| ChatALL:可以同时与多个AI聊天机器人(含清华、讯飞的产品) | 可以同时与多个AI聊天机器人(如ChatGPT、Bing Chat、Bard、Alpaca、Vincuna、Claude、ChatGLM、MOSS、iFlytek Spark、ERNIE等)进行对话的工具。它可以并行发送提示给不同的AI机器人,帮助用户找到最好的回答 | [github-ChatALL](https://github.com/sunner/ChatALL) |
| Chatbot Arena | 实际场景用Elo rating对 LLM 进行基准测试 - 介绍了 Chatbot Arena,一种针对大型语言模型 (LLM) 的基准平台,采用匿名、随机的方式进行对抗评测,评测方式基于国际象棋等竞技游戏中广泛使用的 Elo rating system。发布了9个流行的开源 LLM 模型的 Elo rating 并推出排行榜。平台采用 FastChat 多模型服务系统,在多个语言下提供交互式界面,数据来源于用户投票。总结了 Chatbot Arena 的优点并计划提供更好的采样算法、排名和服务系统 | [截止2023年5月3日](https://lmsys.org/blog/2023-05-03-arena/) |
| 类ChatGPT模型评测总结 | 大型语言模型(LLM)受到广泛关注,这些强大
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
OCR 文字识别 、从包含表格的扫描图片中识别表格和文字、语声迁移、Python口语自然语言处理工具集(英文)、 similarity:相似度计算工具包,java编写、海量中文预训练ALBERT模型 、Transformers 2.0 、基于大规模音频数据集Audi…
资源推荐
资源详情
资源评论
收起资源包目录
OCR 文字识别 、从包含表格的扫描图片中识别表格和文字、语声迁移、Python口语自然语言处理工具集(英文) (111个子文件)
《中华人民共和国职业分类大典》.doc 1.24MB
.DS_Store 6KB
.DS_Store 6KB
.alipay.jpg 131KB
.wechat.jpg 101KB
.img.jpg 52KB
QQpinyin.jpg 7KB
rumors_v170613.json 32.57MB
README.md 135KB
README.md 1KB
donation.md 419B
eisenstein-nlp-notes.pdf 3.2MB
LLM_Survey_Chinese_0418.pdf 2.04MB
中文分词十年又回顾- 2007-2017 CWS-10Year-Review-2.pdf 1.42MB
thirtyw.py 365B
thirtyw.pyc 513B
Company-Names-Corpus(480W).rar 24.78MB
Organization-Names-Corpus(110W).rar 4.61MB
.Home-人生浪费指南-brightgreen.svg 1KB
.Citations-487-red.svg 1KB
.Citations-487-blueviolet.svg 1KB
.猎送门-CV-orange.svg 1KB
Chinese_Names_Corpus_Gender(120W).txt 16.13MB
Chinese_Names_Corpus(120W).txt 11.5MB
English_Cn_Name_Corpus_Gender(48W).txt 11.01MB
30wChinsesSeqDic.txt 7.18MB
English_Cn_Name_Corpus(48W).txt 5.55MB
30wChinsesSeqDic_clean.txt 3.8MB
30wdict_utf8.txt 3.04MB
30wdict.txt 3.04MB
Company-Shorter-Form(28W).txt 2.62MB
Ancient_Names_Corpus(25W).txt 2.51MB
Japanese_Names_Corpus(18W).txt 2.3MB
dict.txt 2.25MB
httpcws_dict.txt 2.22MB
四十万可用搜狗txt词库.txt 1.61MB
out.txt 1.58MB
四十万汉语大词库.txt 1.06MB
百度分词词库.txt 1006KB
同义词库.txt 872KB
42537条伪原创词库.txt 829KB
ChengYu_Corpus(5W).txt 709KB
THUOCL_diming.txt 626KB
fingerDic.txt 552KB
五笔词库.TXT 398KB
反义词库.txt 346KB
THUOCL_animal.txt 313KB
chaizi-ft.txt 313KB
chaizi-jt.txt 304KB
THUOCL_medical.txt 302KB
THUOCL_it.txt 301KB
THUOCL_poem.txt 288KB
THUOCL_law.txt 271KB
train_set.txt 255KB
English_Names_Corpus(2W).txt 230KB
professions.txt 186KB
THUOCL_chengyu.txt 163KB
THUOCL_lishimingren.txt 159KB
THUOCL_food.txt 141KB
fanjian_suoyin.txt 139KB
test_set.txt 74KB
THUOCL_caijing.txt 61KB
songci.txt 60KB
tangshi.txt 48KB
dev_set.txt 36KB
car_dict.txt 32KB
THUOCL_car.txt 32KB
否定词库.txt 26KB
haofang.txt 25KB
wanyue.txt 25KB
parting.txt 24KB
wind.txt 22KB
moon.txt 21KB
yongshihuaigu.txt 18KB
rain.txt 15KB
encouragement.txt 14KB
snow.txt 14KB
love.txt 14KB
flower.txt 12KB
patriotic.txt 12KB
miss.txt 11KB
expressemotion.txt 11KB
百度停用词表.txt 11KB
youguoyoumin.txt 10KB
friendship.txt 10KB
boudoirripinings.txt 9KB
landscape.txt 8KB
四川大学停用词表.txt 8KB
view.txt 8KB
willow.txt 8KB
countryside.txt 7KB
farewell.txt 7KB
frontier.txt 7KB
homesick.txt 6KB
哈工大停用词表.txt 6KB
bird.txt 6KB
中文停用词库.txt 5KB
war.txt 5KB
horse.txt 4KB
mourn.txt 4KB
共 111 条
- 1
- 2
资源评论
「已注销」
- 粉丝: 670
- 资源: 152
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 032-基于AT89C52的手动计数器设计proteus仿真.rar
- 机械设计双工位裹头部外围胶纸设备sw18非常好的设计图纸100%好用.zip
- analysis-region.sql文件 2022年最新全国各省五级行政区划代码及名称数据(省-市-区县-乡镇-村)
- 利用LSTM模型,进行时间序列预测
- 2022 毕业设计,基于 Hadoop 的游戏数据分析系统.zip
- 033-基于AT89C52的直流电机驱动proteus仿真设计.rar
- TPA-LSTM(Python完整源码)
- 【岗位说明】担保公司岗位职责说明.doc
- 【岗位说明】岗位说明书投资分析助理员.doc
- 【岗位说明】岗位说明书证券投资部.xls
- 【岗位说明】公司岗位说明书(投资理财).xls
- 【岗位说明】金融岗位职责.docx
- 【岗位说明】金融公司岗位职责01.doc
- 【岗位说明】基金公司岗位职责说明书.xls
- 【岗位说明】金融岗位描述.docx
- 【岗位说明】金融公司各部门岗位职责及任职条件.doc
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功