<center>
<img style="border-radius: 0.3125em;
box-shadow: 0 2px 4px 0 rgba(34,36,38,.12),0 2px 10px 0 rgba(34,36,38,.08);"
src="./data/.logo图片/.img.jpg"width="180">
<br>
<div style="color:orange; border-bottom: 1px solid #d9d9d9;
display: inline-block;
color: #999;
padding: 2px;">NLP民工的乐园</div>
</center>
<br>
[![](https://img.shields.io/github/stars/fighting41love/funnlp?style=social)](https://github.com/fighting41love/funnlp)
[![](https://img.shields.io/badge/dynamic/json?color=blue&label=%E7%9F%A5%E4%B9%8E%E5%85%B3%E6%B3%A8&query=%24.data.totalSubs&url=https%3A%2F%2Fapi.spencerwoo.com%2Fsubstats%2F%3Fsource%3Dzhihu%26queryKey%3Dmountain-blue-64)](https://www.zhihu.com/people/mountain-blue-64)
[![](data/.logo图片/.捐赠图片/.Citations-487-red.svg)](https://scholar.google.com/citations?hl=en&user=aqZdfDUAAAAJ)
[![](data/.logo图片/.捐赠图片/.Home-%E4%BA%BA%E7%94%9F%E6%B5%AA%E8%B4%B9%E6%8C%87%E5%8D%97-brightgreen.svg)](http://fighting41love.github.io/archives/)
[![](data/.logo图片/.捐赠图片/.%E7%8C%8E%E9%80%81%E9%97%A8-CV-orange.svg)](http://fighting41love.github.io/)
<!-- [![](https://img.shields.io/badge/dynamic/json?color=blueviolet&label=github%20followers&query=%24.data.totalSubs&url=https%3A%2F%2Fapi.spencerwoo.com%2Fsubstats%2F%3Fsource%3Dgithub%26queryKey%3Dfighting41love)](https://github.com/fighting41love) -->
<!-- [![](https://img.shields.io/badge/Homepage-%E4%BA%BA%E7%94%9F%E6%B5%AA%E8%B4%B9%E6%8C%87%E5%8D%97-brightgreen)](http://fighting41love.github.io/archives/) -->
### The Most Powerful NLP-Weapon Arsenal
## NLP民工的乐园: 几乎最全的中文NLP资源库
在入门到熟悉NLP的过程中,用到了很多github上的包,遂整理了一下,分享在这里。
很多包非常有趣,值得收藏,满足大家的收集癖!
如果觉得有用,请分享并star:star:,谢谢!
长期不定时更新,欢迎watch和fork!:heart::heart::heart:
| :fire::fire::fire::fire::fire::fire::fire::fire::fire::fire: |
| ---- |
| * [类ChatGPT的模型评测对比](#类ChatGPT的模型评测对比) <br> * [类ChatGPT的资料](#类ChatGPT的资料) <br>* [类ChatGPT的开源框架](#类ChatGPT的开源框架) <br>* [LLM的训练_推理_低资源_高效训练](#LLM的训练_推理_低资源_高效训练) <br>* [提示工程](#提示工程) <br>* [类ChatGPT的文档问答](#类ChatGPT的文档问答) <br>* [类ChatGPT的行业应用](#类ChatGPT的行业应用) <br>* [类ChatGPT的课程资料](#类ChatGPT的课程资料) <br>* [LLM的安全问题](#LLM的安全问题) <br>* [多模态LLM](#多模态LLM) <br>* [LLM的数据集](#LLM的数据集)
| :eggplant: :cherries: :pear: :tangerine: | :sunflower: :strawberry: :melon: :tomato: :pineapple: |
| ---- | ---- |
| * [语料库](#语料库) <br> * [词库及词法工具](#词库及词法工具) <br> * [预训练语言模型](#预训练语言模型) <br> * [抽取](#抽取) <br> * [知识图谱](#知识图谱) <br> * [文本生成](#文本生成) <br> * [文本摘要](#文本摘要) <br> * [智能问答](#智能问答) <br> * [文本纠错](#文本纠错) | * [文档处理](#文档处理) <br> * [表格处理](#表格处理) <br> * [文本匹配](#文本匹配) <br> * [文本数据增强](#文本数据增强) <br> * [文本检索](#文本检索) <br> * [阅读理解](#阅读理解) <br> * [情感分析](#情感分析) <br> * [常用正则表达式](#常用正则表达式) <br> * [语音处理](#语音处理) |
| * [常用正则表达式](#常用正则表达式) <br> * [事件抽取](#事件抽取) <br> * [机器翻译](#机器翻译) <br> * [数字转换](#数字转换) <br> * [指代消解](#指代消解) <br> * [文本聚类](#文本聚类) <br> * [文本分类](#文本分类) <br> * [知识推理](#知识推理) <br> * [可解释NLP](#可解释自然语言处理) <br> * [文本对抗攻击](#文本对抗攻击) | * [文本可视化](#文本可视化) <br> * [文本标注工具](#文本标注工具) <br> * [综合工具](#综合工具) <br> * [有趣搞笑工具](#有趣搞笑工具) <br> * [课程报告面试等](#课程报告面试等) <br> * [比赛](#比赛) <br> * [金融NLP](#金融自然语言处理) <br> * [医疗NLP](#医疗自然语言处理) <br> * [法律NLP](#法律自然语言处理) <br> * [文本生成图像](#文本生成图像) <br> * [其他](#其他) |
<!--
目录(Table of contents)
=================
<table border="0">
<tr>
<td><b style="font-size:30px">:star:</b></td>
<td><b style="font-size:30px">:star::star:</b></td>
<td><b style="font-size:30px">:star::star::star:</b></td>
<td><b style="font-size:30px">:star::star::star::star:</b></td>
</tr>
<tr>
<td>
<!--ts-->
<!-- * [语料库](#语料库)
* [词库及词法工具](#词库及词法工具)
* [预训练语言模型](#预训练语言模型)
* [抽取](#抽取)
* [知识图谱](#知识图谱)
* [文本生成](#文本生成)
* [文本摘要](#文本摘要)
* [智能问答](#智能问答)
* [文本纠错](#文本纠错) -->
<!--te-->
</td>
<td>
<!--ts-->
<!-- * [文档处理](#文档处理)
* [表格处理](#表格处理)
* [文本匹配](#文本匹配)
* [文本数据增强](#文本数据增强)
* [文本检索](#文本检索)
* [阅读理解](#阅读理解)
* [情感分析](#情感分析)
* [常用正则表达式](#常用正则表达式)
* [语音处理](#语音处理) -->
<!--te-->
</td>
<td>
<!--ts-->
<!-- * [常用正则表达式](#常用正则表达式)
* [事件抽取](#事件抽取)
* [机器翻译](#机器翻译)
* [数字转换](#数字转换)
* [指代消解](#指代消解)
* [文本聚类](#文本聚类)
* [文本分类](#文本分类)
* [知识推理](#知识推理)
* [可解释NLP](#可解释自然语言处理)
* [文本对抗攻击](#文本对抗攻击) -->
<!--te-->
</td>
<td>
<!--ts-->
<!--
* [文本可视化](#文本可视化)
* [文本标注工具](#文本标注工具)
* [综合工具](#综合工具)
* [有趣搞笑工具](#有趣搞笑工具)
* [课程报告面试等](#课程报告面试等)
* [比赛](#比赛)
* [金融NLP](#金融自然语言处理)
* [医疗NLP](#医疗自然语言处理)
* [法律NLP](#法律自然语言处理)
* [其他](#其他) -->
<!--te-->
<!-- </td>
</tr>
</table> -->
----
# 类ChatGPT的模型评测对比
| 资源名(Name) | 描述(Description) | 链接 |
| :--- | :---- | :--- |
| ChatALL:可以同时与多个AI聊天机器人(含清华、讯飞的产品) | 可以同时与多个AI聊天机器人(如ChatGPT、Bing Chat、Bard、Alpaca、Vincuna、Claude、ChatGLM、MOSS、iFlytek Spark、ERNIE等)进行对话的工具。它可以并行发送提示给不同的AI机器人,帮助用户找到最好的回答 | [github-ChatALL](https://github.com/sunner/ChatALL) |
| Chatbot Arena | 实际场景用Elo rating对 LLM 进行基准测试 - 介绍了 Chatbot Arena,一种针对大型语言模型 (LLM) 的基准平台,采用匿名、随机的方式进行对抗评测,评测方式基于国际象棋等竞技游戏中广泛使用的 Elo rating system。发布了9个流行的开源 LLM 模型的 Elo rating 并推出排行榜。平台采用 FastChat 多模型服务系统,在多个语言下提供交互式界面,数据来源于用户投票。总结了 Chatbot Arena 的优点并计划提供更好的采样算法、排名和服务系统 | [截止2023年5月3日](https://lmsys.org/blog/2023-05-03-arena/) |
| 类ChatGPT模型评测总结 | 大型语言模型(LLM)受到广泛关注,这些强大
没有合适的资源?快使用搜索试试~ 我知道了~
NLP从入门到跑路的全部资料
共111个文件
txt:83个
jpg:4个
svg:4个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 44 浏览量
2023-09-22
21:11:41
上传
评论
收藏 73.77MB ZIP 举报
温馨提示
中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、历史名人词库、诗词词库、医学词库、饮食词库、法律词库、汽车词库、动物词库、中文聊天语料、中文谣言数据、百度中文问答数据集、句子相似度匹配算法集合、bert资源、文本生成&摘要相关工具、
资源推荐
资源详情
资源评论
收起资源包目录
NLP从入门到跑路的全部资料 (111个子文件)
《中华人民共和国职业分类大典》.doc 1.24MB
.DS_Store 6KB
.DS_Store 6KB
.alipay.jpg 131KB
.wechat.jpg 101KB
.img.jpg 52KB
QQpinyin.jpg 7KB
rumors_v170613.json 32.57MB
README.md 135KB
README.md 1KB
donation.md 419B
eisenstein-nlp-notes.pdf 3.2MB
LLM_Survey_Chinese_0418.pdf 2.04MB
中文分词十年又回顾- 2007-2017 CWS-10Year-Review-2.pdf 1.42MB
thirtyw.py 365B
thirtyw.pyc 513B
Company-Names-Corpus(480W).rar 24.78MB
Organization-Names-Corpus(110W).rar 4.61MB
.Home-人生浪费指南-brightgreen.svg 1KB
.Citations-487-red.svg 1KB
.Citations-487-blueviolet.svg 1KB
.猎送门-CV-orange.svg 1KB
Chinese_Names_Corpus_Gender(120W).txt 16.13MB
Chinese_Names_Corpus(120W).txt 11.5MB
English_Cn_Name_Corpus_Gender(48W).txt 11.01MB
30wChinsesSeqDic.txt 7.18MB
English_Cn_Name_Corpus(48W).txt 5.55MB
30wChinsesSeqDic_clean.txt 3.8MB
30wdict_utf8.txt 3.04MB
30wdict.txt 3.04MB
Company-Shorter-Form(28W).txt 2.62MB
Ancient_Names_Corpus(25W).txt 2.51MB
Japanese_Names_Corpus(18W).txt 2.3MB
dict.txt 2.25MB
httpcws_dict.txt 2.22MB
四十万可用搜狗txt词库.txt 1.61MB
out.txt 1.58MB
四十万汉语大词库.txt 1.06MB
百度分词词库.txt 1006KB
同义词库.txt 872KB
42537条伪原创词库.txt 829KB
ChengYu_Corpus(5W).txt 709KB
THUOCL_diming.txt 626KB
fingerDic.txt 552KB
五笔词库.TXT 398KB
反义词库.txt 346KB
THUOCL_animal.txt 313KB
chaizi-ft.txt 313KB
chaizi-jt.txt 304KB
THUOCL_medical.txt 302KB
THUOCL_it.txt 301KB
THUOCL_poem.txt 288KB
THUOCL_law.txt 271KB
train_set.txt 255KB
English_Names_Corpus(2W).txt 230KB
professions.txt 186KB
THUOCL_chengyu.txt 163KB
THUOCL_lishimingren.txt 159KB
THUOCL_food.txt 141KB
fanjian_suoyin.txt 139KB
test_set.txt 74KB
THUOCL_caijing.txt 61KB
songci.txt 60KB
tangshi.txt 48KB
dev_set.txt 36KB
car_dict.txt 32KB
THUOCL_car.txt 32KB
否定词库.txt 26KB
haofang.txt 25KB
wanyue.txt 25KB
parting.txt 24KB
wind.txt 22KB
moon.txt 21KB
yongshihuaigu.txt 18KB
rain.txt 15KB
encouragement.txt 14KB
snow.txt 14KB
love.txt 14KB
flower.txt 12KB
patriotic.txt 12KB
miss.txt 11KB
expressemotion.txt 11KB
百度停用词表.txt 11KB
youguoyoumin.txt 10KB
friendship.txt 10KB
boudoirripinings.txt 9KB
landscape.txt 8KB
四川大学停用词表.txt 8KB
view.txt 8KB
willow.txt 8KB
countryside.txt 7KB
farewell.txt 7KB
frontier.txt 7KB
homesick.txt 6KB
哈工大停用词表.txt 6KB
bird.txt 6KB
中文停用词库.txt 5KB
war.txt 5KB
horse.txt 4KB
mourn.txt 4KB
共 111 条
- 1
- 2
资源评论
智达教育
- 粉丝: 2w+
- 资源: 279
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 硕飞烧录器上位机软件及nand flash制作烧录文件及烧录方法
- genad-hGridSample-test.hbm
- 通信原理(第七版 樊昌信 曹丽娜)思维导图
- 基于python的网络爬虫爬取天气数据及可视化分析python大作业源码
- 老鼠图像目标检测数据【已标注,约1100张数据,YOLO 标注格式】
- 简易制作java1.8环境的docker镜像包arm64
- C#课程的最终大作业,个人Blog带db数据库文件winform
- 技术册投标文件的的查重
- J6上板测试模型,原始版本
- 基于python的网络爬虫爬取天气数据及可视化分析系统源码
- 基于 springboot+vue 的高校宿舍管理系统设计与实现 前端:Vue3 后端Springboot 数据库MySQL 含参考Word 可作为毕设参考,项目完整拿来即用 有数据库文件
- 基于java的商城积分系统(编号:90821116).zip
- 基于Java的电影院售票管理系统(编号:63808153).zip
- 基于java的电缆行业生产管理系统(编号:474342100).zip
- 基于java的网上订餐系统(编号:96717170).zip
- 基于python的网络爬虫爬取天气数据及可视化分析项目源码
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功