自然语言处理_人工智能_IT技术下载资源-CSDN开发者文库

综合最新热门
条件随机场是目前机器学习模型中最有效的模型之一，广泛地应用于自然语言处理（例如词性标注、浅层句法分析）和图像模式识别（例如对复杂图像中物体的识别）等领域中。该教程详细地探讨了条件随机场的由来，把朴素贝叶斯(NB)、隐马尔科夫(HMM)、最大熵马尔科夫模型(MEMM)与条件随机场的关系探讨得十分详尽，让读者由浅入深，由简入繁，可谓浅显易懂、耳目一新、使人受益匪浅！

        条件随机场（史上最牛条件随机场教程）
       5 9浏览

        会员免费
      
本书共分为四大部分：, 基础篇（1～10章）介绍了Spark的用途、扩展、安装、运行模式、程序开发、编程模型、工作原理，以及SparkSQL、SparkStreaming、MLlib、GraphX、Bagel等重要的扩展；, 实战篇（11～14）讲解了搜索结果的排序、个性化推荐系统、日志分析系统、自然语言处理、数据挖掘等方面的案例；, 高级篇（15～18）则讲解了Spark的调度管理、存储管理、监控管理、性能优化、最佳实践以及重点算法的解读；, 扩展篇（19～20）讲解了Sparkjob-server和Tachyon。

        Spark核心技术与高级应用
       4 0浏览

        会员免费
      
stable-diffusion
大小：2MB
stable-diffusion部署需要的包
stable-diffusion部署需要的包

        stable-diffusion部署需要的包
       0 3858浏览
免费
网易新闻语料
大小：38MB
网易新闻语料库 文本分类 自然语言处理 网上基本找不到哦~~
网易新闻语料库 文本分类 自然语言处理 网上基本找不到哦~~

        网易新闻语料库 文本分类 自然语言处理
       5 1010浏览

        会员免费
      
自然语言处理
大小：983KB
用于自然语言理解课程，分词，词性标注使用的词典
用于自然语言理解课程，分词，词性标注使用的词典

        自然语言处理中文词库（含词性）
       4 1219浏览

        会员免费
      
语言模型
大小：23MB
大规模语言模型（Large Language Models，LLM），也称大规模语言模型 或大型语言模型 ，是一种
由包含数百亿以上参数的深度神经网络构建的语言模型，使用自监督学习方法通过大量无标注文
本进行训练。自 2018 年以来，Google、OpenAI、Meta、百度、华为等公司和研究机构都相继发布
了包括 BERT[1]，GPT[6] 等在内多种模型，并在几乎所有自然语言处理任务中都表现出色。2019 年
大模型呈现爆发式的增长，特别是 2022 年 11 月 ChatGPT（Chat Generative Pre-trained Transformer）
发布后，更是引起了全世界的广泛关注。用户可以使用自然语言与系统交互，从而实现包括问答、
分类、摘要、翻译、聊天等从理解到生成的各种任务。大型语言模型展现出了强大的对世界知识
掌握和对语言的理解。
大规模语言模型（Large Language Models，LLM），也称大规模语言模型 或大型语言模型 ，是一种
由包含数百亿以上参数的深度神经网络构建的语言模型，使用自监督学习方法通过大量无标注文
本进行训练。自 2018 年以来，Google、OpenAI、Meta、百度、华为等公司和研究机构都相继发布
了包括 BERT[1]，GPT[6] 等在内多种模型，并在几乎所有自然语言处理任务中都表现出色。2019 年
大模型呈现爆发式的增长，特别是 2022 年 11 月 ChatGPT（Chat Generative Pre-trained Transformer）
发布后，更是引起了全世界的广泛关注。用户可以使用自然语言与系统交互，从而实现包括问答、
分类、摘要、翻译、聊天等从理解到生成的各种任务。大型语言模型展现出了强大的对世界知识
掌握和对语言的理解。

         大规模语言模型：从理论到实践
       5 4607浏览
免费
Ansj中文分词
大小：13MB
Ansj中文分词是一款纯Java、主要用于自然语言处理、高精度的中文分词工具，目标是“准确、高效、自由地进行中文分词”。
内容简介：http://www.iteye.com/magazines/102#234

此分词具有自己学习的功能,所以拜托大家不要.乱提交数据.会带坏人家的.说着神秘.其实是一种机器学习动态规划模型!如果你发现此模式分词存在问题.可以看.新词发现.是此分词的初始版本!

此分词保证了准确率,具有人名识别的功能!

此分词结果,具有新词发现,人名识别,机构名识别.也许准确率稍差.但是非常具有应用价值!

献给广大使用lucene要求高召回率的同学.没什么技术含量.但是很实用!
Ansj中文分词是一款纯Java、主要用于自然语言处理、高精度的中文分词工具，目标是“准确、高效、自由地进行中文分词”。
内容简介：http://www.iteye.com/magazines/102#234

此分词具有自己学习的功能,所以拜托大家不要.乱提交数据.会带坏人家的.说着神秘.其实是一种机器学习动态规划模型!如果你发现此模式分词存在问题.可以看.新词发现.是此分词的初始版本!

此分词保证了准确率,具有人名识别的功能!

此分词结果,具有新词发现,人名识别,机构名识别.也许准确率稍差.但是非常具有应用价值!

献给广大使用lucene要求高召回率的同学.没什么技术含量.但是很实用!

        Ansj中文分词（强大）
       5 1672浏览

        会员免费
      
线性代数
大小：12MB
线性代数-同济大学第七版
线性代数-同济大学第七版

        线性代数-同济大学第七版
       4 6073浏览

        会员免费
      
这个 GPT 链接是 OpenAI 的 GPT-3.5、4 模型，它是目前最先进的自然语言处理模型之一。使用这个链接可以让你与该模型进行实时对话，输入文本后，该模型会给出一个智能的、语义正确的回答。这个链接可以用于多种场景，例如智能客服、智能助手等。基于 GPT-3.5、4 模型的强大能力，它可以提供高质量的自然语言理解和生成功能，为人们的生活和工作带来便利。

        21个免费无限制免登录chatgpt资源， OpenAI GPT-4\3.5 模型的智能对话链接
       5 8053浏览
免费
SLAM
大小：40MB
《SLAM导航机器人零基础实战系列》讲义
第1章：Linux基础

1.Linux简介

2.安装Linux发行版ubuntu系统

3.Linux命令行基础操作

第2章：ROS入门

1.ROS是什么

2.ROS系统整体架构

3.在ubuntu16.04中安装ROS kinetic

4.如何编写ROS的第一个程序hello_world

5.编写简单的消息发布器和订阅器

6.编写简单的service和client

7.理解tf的原理

8.理解roslaunch在大型项目中的作用

9.熟练使用rviz

10.在实际机器人上运行ROS高级功能预览

第3章：感知与大脑

1.ydlidar-x4激光雷达

2.带自校准九轴数据融合IMU惯性传感器

3.轮式里程计与运动控制

4.音响麦克风与摄像头

5.机器人大脑嵌入式主板性能对比

6.做一个能走路和对话的机器人

第4章：差分底盘设计

1.stm32主控硬件设计

2.stm32主控软件设计

3.底盘通信协议

4.底盘ROS驱动开发

5.底盘PID控制参数整定

6.底盘里程计标

第5章：树莓派3开发环境搭建

1.安装系统ubuntu_mate_16.04

2.安装ros-kinetic

3.装机后一些实用软件安装和系统设置

4.PC端与robot端ROS网络通信

5.Android手机端与robot端ROS网络通信

6.树莓派USB与tty串口号绑定

7.开机自启动ROS节点

第6章：SLAM建图与自主避障导航

1.在机器人上使用传感器

2.google-cartographer机器人SLAM建图

3.ros-navigation机器人自主避障导航

4.多目标点导航及任务调度

5.机器人巡航与现场监控

第7章：语音交互与自然语言处理

1.语音交互相关技术

2.机器人语音交互实现

3.自然语言处理云计算引擎
《SLAM导航机器人零基础实战系列》讲义
第1章：Linux基础

1.Linux简介

2.安装Linux发行版ubuntu系统

3.Linux命令行基础操作

第2章：ROS入门

1.ROS是什么

2.ROS系统整体架构

3.在ubuntu16.04中安装ROS kinetic

4.如何编写ROS的第一个程序hello_world

5.编写简单的消息发布器和订阅器

6.编写简单的service和client

7.理解tf的原理

8.理解roslaunch在大型项目中的作用

9.熟练使用rviz

10.在实际机器人上运行ROS高级功能预览

第3章：感知与大脑

1.ydlidar-x4激光雷达

2.带自校准九轴数据融合IMU惯性传感器

3.轮式里程计与运动控制

4.音响麦克风与摄像头

5.机器人大脑嵌入式主板性能对比

6.做一个能走路和对话的机器人

第4章：差分底盘设计

1.stm32主控硬件设计

2.stm32主控软件设计

3.底盘通信协议

4.底盘ROS驱动开发

5.底盘PID控制参数整定

6.底盘里程计标

第5章：树莓派3开发环境搭建

1.安装系统ubuntu_mate_16.04

2.安装ros-kinetic

3.装机后一些实用软件安装和系统设置

4.PC端与robot端ROS网络通信

5.Android手机端与robot端ROS网络通信

6.树莓派USB与tty串口号绑定

7.开机自启动ROS节点

第6章：SLAM建图与自主避障导航

1.在机器人上使用传感器

2.google-cartographer机器人SLAM建图

3.ros-navigation机器人自主避障导航

4.多目标点导航及任务调度

5.机器人巡航与现场监控

第7章：语音交互与自然语言处理

1.语音交互相关技术

2.机器人语音交互实现

3.自然语言处理云计算引擎

        SLAM导航机器人零基础实战系列-全部PDF文档整理.zip
       5 4271浏览
免费
人工智能
大小：4MB
最近ChatGPT智能AI聊天突然爆火了
ChatGPT 是 OpenAI 开发的一款专门从事对话的人工智能聊天机器人原型。
聊天机器人是一种大型语言模型，采用监督学习和强化学习技术。
ChatGPT 于 2022 年 11 月推出，尽管其回答事实的准确性受到批评，但因其详细和清晰的回复而受到关注。
ChatGPT 使用监督学习和强化学习在 GPT-3.5 之上进行了微调和升级。
ChatGPT的相关模型是OpenAI与微软合作在其 Azure 超级计算基础设施上进行训练的。
ChatGPT 的训练数据包括手册页、互联网现象和编程语言的知识，例如公告板系统和 Python 编程语言。
今天就给大家带来一款小程序版本的程序
包含前后端安装比较简单的其实
PS:api需要用户自行注册获取哈
最近ChatGPT智能AI聊天突然爆火了
ChatGPT 是 OpenAI 开发的一款专门从事对话的人工智能聊天机器人原型。
聊天机器人是一种大型语言模型，采用监督学习和强化学习技术。
ChatGPT 于 2022 年 11 月推出，尽管其回答事实的准确性受到批评，但因其详细和清晰的回复而受到关注。
ChatGPT 使用监督学习和强化学习在 GPT-3.5 之上进行了微调和升级。
ChatGPT的相关模型是OpenAI与微软合作在其 Azure 超级计算基础设施上进行训练的。
ChatGPT 的训练数据包括手册页、互联网现象和编程语言的知识，例如公告板系统和 Python 编程语言。
今天就给大家带来一款小程序版本的程序
包含前后端安装比较简单的其实
PS:api需要用户自行注册获取哈

        ChatGPT智能AI机器人微信小程序源码-带部署教程
       5 4570浏览
免费
**内容概要:** 人工智能大模型是近年来迅速发展的技术领域，旨在构建具有人类智能水平的模型。通过大规模数据和深度学习方法，这些模型能够处理自然语言理解、图像识别、自动驾驶等复杂任务。本资源推荐旨在介绍人工智能大模型的相关资源，助您深入了解和应用这一领域的最新进展。
                                  
**适用群体:** 本资源推荐适用于各类人群，对人工智能大模型感兴趣的任何人。对于想要了解和应用人工智能大模型的人来说，这些资源将起到极大的帮助作用。

**使用场景及目标:** 人工智能大模型的应用场景非常广泛。这些模型在自然语言处理、计算机视觉、语音识别、推荐系统等场景中具有重要的应用价值。通过使用这些模型，您可以实现智能问答系统、图像识别应用、人脸识别技术、智能推荐等多种目标。

**其他说明:** 
- GitHub代码库：推荐查阅优秀的开源代码库，如OpenAI的GPT系列、Google的BERT和Facebook的DALL·E等，在这些仓库中，您可以找到相关的论文、实现代码和预训练模型。
- 研究论文：大量的人工智能大模型的研究论文可供参考。

        人工智能大模型介绍.pptx
       0 2136浏览
免费
transformer
大小：5KB
之前的文章好多人蹲代码 这就上传了
之前的文章好多人蹲代码 这就上传了

        transformer代码
       5 2754浏览
免费
自然语言处理的宝典，英文版，第二版，很经典的，希望对大家有帮助：）20个字符好难才能凑齐啊～～～

        Speech and Language Processing 2nd edition
       4 428浏览

        会员免费
      
同义词
大小：372KB
词语相似度计算，语义计算，用于人工智能，自然语言处理，数据挖掘，舆情分析等众多领域。
词语相似度计算，语义计算，用于人工智能，自然语言处理，数据挖掘，舆情分析等众多领域。

        同义词词林（哈工大扩展版） + Python词语相似度计算源代码
       4 2985浏览

        会员免费
      
停用词
大小：4KB
中文处理中可能会用的停用词表，用来过滤掉无用信息。<br>我综合处理了多个中文停用词表，希望能对大家有用。
中文处理中可能会用的停用词表，用来过滤掉无用信息。<br>我综合处理了多个中文停用词表，希望能对大家有用。

        中文停用词表
       5 325浏览

        会员免费
      
宗成庆
大小：3MB
国内经典教材,不可不看的一本书.中部最新PPT
国内经典教材,不可不看的一本书.中部最新PPT

        宗成庆 统计自然语言处理 中
       4 386浏览

        会员免费
      
驾驭文本 文本的发现、组织和处理，pdf完整带书签版！

        驾驭文本 文本的发现、组织和处理
       5 226浏览

        会员免费
      
自己动手写搜索引擎	1
第1章 了解搜索引擎	1
1.1 Google神话	1
1.2 体验搜索引擎	1
1.3 你也可以做搜索引擎	4
1.4 本章小结	4
第2章 遍历搜索引擎技术	5
2.1 30分钟实现的搜索引擎	5
2.1.1 准备工作环境（10分钟）	5
2.1.2 编写代码（15分钟）	6
2.1.3 发布运行（5分钟）	9
2.2 搜索引擎基本技术	14
2.2.1 网络蜘蛛	14
2.2.2 全文索引结构	14
2.2.3 Lucene 全文检索引擎	15
2.2.4 Nutch网络搜索软件	15
2.2.5 用户界面	17
2.3 商业搜索引擎技术介绍	17
2.3.1 通用搜索	17
2.3.2 垂直搜索	18
2.3.3 站内搜索	19
2.3.4 桌面搜索	21
2.4 本章小结	21
第3章 获得海量数据	22
3.1 自己的网络蜘蛛	22
3.1.1 BerkeleyDB介绍	27
3.1.2 抓取网页	28
3.1.3 MP3 抓取	29
3.1.4 RSS 抓取	30
3.1.5 图片抓取	33
3.1.6 垂直行业抓取	34
3.2 抓取数据库中的内容	36
3.2.1 建立数据视图	36
3.2.2 JDBC数据库连接	36
3.2.3 增量抓取	40
3.3 抓取本地硬盘上的文件	41
3.3.1 目录遍历	41
3.4 本章小结	42
第4章 提取文档中的文本内容	43
4.1 从HTML文件中提取文本	43
4.1.1 HtmlParser介绍	51
4.1.2 结构化信息提取	54
4.1.3 网页去噪	60
4.1.4 网页结构相似度计算	63
4.1.5 正文提取的工具FireBug	64
4.1.6 正文提取的工具NekoHTML	66
4.1.7 正文提取	68
4.2 从非HTML文件中提取文本	73
4.2.1 TEXT文件	73
4.2.2 PDF文件	73
4.2.3 Word文件	82
4.2.4 Rtf文件	82
4.2.5 Excel文件	83
4.2.6 PowerPoint文件	84
4.3 流媒体内容提取	85
4.3.1 音频流内容提取	85
4.3.2 视频流内容提取	87
4.4 抓取限制应对方法	89
4.5 本章小结	90
第5章 自然语言处理	91
5.1 中文分词处理	91
5.1.1 Lucene 中的中文分词	91
5.1.2 Lietu中文分词的使用	92
5.1.3 中文分词的原理	92
5.1.4 查找词典算法	95
5.1.5 最大概率分词方法	98
5.1.6 新词发现	101
5.1.7 隐马尔可夫模型	102
5.2 语法解析树	104
5.3 文档排重	105
5.4 中文关键词提取	106
5.4.1 关键词提取的基本方法	106
5.4.2 关键词提取的设计	107
5.4.3 从网页提取关键词	107
5.5 相关搜索	107
5.6 拼写检查	110
5.6.1 英文拼写检查	110
5.6.2 中文拼写检查	112
5.7 自动摘要	116
5.7.1 自动摘要技术	117
5.7.2 自动摘要的设计	117
5.7.3 Lucene中的动态摘要	124
5.8 自动分类	125
5.8.1 Classifier4J	126
5.8.2 自动分类的接口定义	127
5.8.3 自动分类的SVM方法实现	128
5.8.4 多级分类	128
5.9 自动聚类	131
5.9.1 聚类的定义	131
5.9.2 K均值聚类方法	131
5.9.3 K均值实现	133
5.10 拼音转换	138
5.11 语义搜索	139
5.12 跨语言搜索	143
5.13 本章小结	144
第6章 创建索引库	145
6.1 设计索引库结构	146
6.1.1 理解 Lucene 的索引库结构	146
6.1.2 设计一个简单的索引库	148
6.2 创建和维护索引库	149
6.2.1 创建索引库	149
6.2.2 向索引库中添加索引文档	149
6.2.3 删除索引库中的索引文档	151
6.2.4 更新索引库中的索引文档	151
6.2.5 索引的合并	151
6.2.6 索引的定时更新	152
6.2.7 索引的备份和恢复	153
6.2.8 修复索引	154
6.3 读写并发控制	154
6.4 优化使用 Lucene	155
6.4.1 索引优化	155
6.4.2 查询优化	157
6.4.3 实现时间加权排序	162
6.4.4 实现字词混合索引	163
6.4.5 定制Similarity	170
6.4.6 定制Tokenizer	171
6.5 查询大容量索引	173
6.6 本章小结	174
第7章 用户界面设计与实现	175
7.1 Lucene 搜索接口(search代码)	175
7.2 搜索页面设计	176
7.2.1 用于显示搜索结果的 taglib	176
7.2.2 用于搜索结果分页的 taglib	178
7.2.3 设计一个简单的搜索页面	180
7.3 实现搜索接口	183
7.3.1 布尔搜索	183
7.3.2 指定范围搜索	183
7.3.3 设置过滤条件	188
7.3.4 搜索结果排序	188
7.3.5 搜索页面的索引缓存与更新	190
7.4 实现关键词高亮显示	191
7.5 实现多维视图	194
7.6 实现相似文档搜索	200
7.7 实现AJAX自动完成	203
7.7.1 总体结构	203
7.7.2 服务器端处理	203
7.7.3 浏览器端处理	205
7.7.4 服务器端改进	206
7.7.5 部署总结	217
7.8 jQuery实现的自动完成	217
7.9 集成其他功能	223
7.9.1 拼写检查	223
7.9.2 分类统计	223
7.9.3 相关搜索	223
7.9.4 再次查找	226
7.9.5 搜索日志	226
7.10 搜索日志分析	228
7.11 本章小结	231
第8章 其他高级主题	232
8.1 使用Solr实现分布式搜索	232
8.1.1 Solr服务器端的配置与中文支持	232
8.1.2 把数据放进Solr	237
8.1.3 删除数据	240
8.1.4 客户端搜索界面	241
8.1.5 Solr索引库的查找	242
8.1.6 索引分发	246
8.1.7 Solr搜索优化	246
8.1.8 Solr中字词混合索引	249
8.1.9 相关检索	253
8.1.10 搜索结果去重	255
8.1.11 分布式搜索	260
8.1.12 SolrJ查询分析器	264
8.1.13 扩展SolrJ	276
8.1.14 扩展Solr	277
8.1.15 Solr的.net客户端	285
8.1.16 Solr的php客户端	286
8.2 图片搜索	291
8.2.1 图像的OCR识别	292
8.3 竞价排名	296
8.4 Web图分析	297
8.5 使用并行程序分析数据	302
8.6 RSS搜索	303
8.7 本章小结	304
参考资源	305
书籍	305
网址	305
本书中的章节和代码对照表	306

        自己动手写搜索引擎(罗刚著).doc
       5 591浏览

        会员免费
      
中文语料
大小：4MB
最初在中文自然语言处理开放平台上获得，由复旦大学李荣陆博士收集整理
最初在中文自然语言处理开放平台上获得，由复旦大学李荣陆博士收集整理

        中文文本分类语料库适于小规模研究
       5 300浏览

        会员免费
      
Matlab
大小：44KB
在Matlab环境下识别男女声，主要方法是利用倒频谱检测基音频率，基因频率是区分男女声的特征
在Matlab环境下识别男女声，主要方法是利用倒频谱检测基音频率，基因频率是区分男女声的特征

        Matlab男女声在线识别系统
       3 4741浏览

        会员免费
      
同义词词林
大小：680KB
同义词词林哈工大扩展版 在做搜索和数据挖掘和自然语言处理时有用，也可以用来计算词语的相似度
同义词词林哈工大扩展版 在做搜索和数据挖掘和自然语言处理时有用，也可以用来计算词语的相似度

        同义词词林哈工大扩展版
       5 595浏览

        会员免费
      
斯坦福
大小：3MB
斯坦福 cs224d 深度学习与自然语言处理讲义
斯坦福 cs224d 深度学习与自然语言处理讲义

        斯坦福 cs224d 深度学习与自然语言处理讲义
       5 295浏览

        会员免费
      
nltk
大小：11KB
nltk的download速度太慢，手动提取了里面的地址，有需要的可以拿去手动下载，浏览器打开后，直接迅雷下载全部链接就可以了，速度基本满速。
nltk的download速度太慢，手动提取了里面的地址，有需要的可以拿去手动下载，浏览器打开后，直接迅雷下载全部链接就可以了，速度基本满速。

        nltk_data数据包
       1 1984浏览

        会员免费
      
停用词
大小：7KB
本停用词表，是我整理了CSDN上的资源，以及其他的网上停用词表资源得到的。可以用于自然语言处理，机器翻译，信息检索等。
本停用词表，是我整理了CSDN上的资源，以及其他的网上停用词表资源得到的。可以用于自然语言处理，机器翻译，信息检索等。

        中文停用词表（比较全面，有1208个停用词）
       5 1454浏览

        会员免费
      
计算机自然语言处理是用计算机通过可计算的方法对自然语言的各级语言
单位（字、词、语句、篇章等等）进行转换、传输、存贮、分析等加工处理的
科学。是一门与语言学、计算机科学、数学、心理学、信息论、声学相联系的
交叉性学科。国际互联网技术的飞速发展，极大地推动了信息处理技术的发展，
也为信息处理技术不断提出新的需求。语言作为信息的载体，语言处理技术已
经日益成为全球信息化和我国社会和经济发展的重要支撑性技术。 
本书全面阐述了自然语言处理技术的基本原理和实用方法，全书共分为基
础、原理和应用三个篇章。第一章是概论；由第二章、第三章构成本书的基础
篇，论述了自然语言处理技术的数学基础和中文语言处理特有的自动分词技术；
第四章、第五章构成了本书的原理篇，分别论述了基于统计和基于语言学规则
的语言处理技术的基本原理；第六章、第七章、第八章、第九章构成了本书的
应用篇，论述了在音字转换、自动文摘、信息检索、手写体识别等应用领域中
的实用语言处理方法。 
本书可供有志于从事自然语言处理技术研究和应用开发的计算机相关专业
的研究生，大学高年级学生和科技人员参考，也可以作为相关专业研究生的专
业课教材。

        计算机自然语言处理
       5 571浏览

        会员免费
      
中科院宗成庆 自然语言处理 期末试题

        宗成庆 自然语言处理 期末试题.pdf
       2 1896浏览

        会员免费
      
自然语言处理
大小：13MB
统计自然语言处理（第2版）mobi版
统计自然语言处理（第2版）mobi版

        统计自然语言处理（第2版
       5 230浏览

        会员免费
      
老板从清华大学搞来的他们项目团队讲解最大上模型的ppt，内容很生动，也蛮详细的。内容包括最大熵模型的提出和相关模型推导、特征提取问题。

        最大熵模型讲解PPT，很详细
       5 874浏览

        会员免费
      
Python开发-自然语言处理
大小：50KB
This repo contains a PyTorch implementation of a pretrained BERT model for multi-label text classification.
This repo contains a PyTorch implementation of a pretrained BERT model for multi-label text classification.

        Python-PyTorch实现的BERT多标签文本分类
       0 1w+浏览

        会员免费
      
知识图谱
大小：97MB
1708-cnschema-final.pdf
鼎复金融知识图谱介绍.pdf
知识获取方法.pdf
知识图谱导论.pdf
知识图谱构建.pdf
知识图谱实践.pdf
CCKS-2017 行业知识图谱构建与应用-下篇.pdf
CCKS-2017-行业知识图谱构建与应用101.pdf
CCKS-2017行业知识图谱构建与应用-上篇.pdf
CCKS2017Handbook.pdf
CCKS交流-语音交互中的自然语言处理技术.pdf
1708-cnschema-final.pdf
鼎复金融知识图谱介绍.pdf
知识获取方法.pdf
知识图谱导论.pdf
知识图谱构建.pdf
知识图谱实践.pdf
CCKS-2017 行业知识图谱构建与应用-下篇.pdf
CCKS-2017-行业知识图谱构建与应用101.pdf
CCKS-2017行业知识图谱构建与应用-上篇.pdf
CCKS2017Handbook.pdf
CCKS交流-语音交互中的自然语言处理技术.pdf

        知识图谱_中文知识图谱_ CIPS（中国中文信息学会）_CCKS2017.zip
       5 1282浏览

        会员免费
      
Wav
大小：1MB
Java离线版语音识别-语音转文字的音频测试文件，对应文章路径为：https://lijinjiang.blog.csdn.net/article/details/127069618
Java离线版语音识别-语音转文字的音频测试文件，对应文章路径为：https://lijinjiang.blog.csdn.net/article/details/127069618

        Speech Wav Resource
       0 1267浏览
免费
jurafsky and martin speech and language processing 2nd edition pdf download 第二版，非第一版草稿版。自然语言处理圣书！必读！

        jurafsky and martin speech and language processing 2nd edition pdf download
       3 386浏览

        会员免费
      
这本书有什么不同：

1、从书名，到大纲，到内容，基本都来自ChatGPT的自述，本人只是负责编辑。

2、整个成书过程只用了2小时不到。

3、同时生成中英文版本。

        一本关于ChatGPT的书《ChatGPT 革命：了解大型语言模型的力量》中文版
       0 1761浏览
免费
计算语言学
大小：9MB
中国科学院研究生院信息学院 硕士生课程 刘群教授主讲。
本课程为计算机软件与理论专业研究生的专业基础课。通过本课程的学习，使同学掌握计算语言学的基本理论，了解自然语言处理的常用模型和算法，初步具备从事相关领域研究工作的能力。
内容提要：

第一章  概论

    介绍计算语言学的研究对象，研究手段，学科特点，历史趋势等。

第二章  词典

    词典编纂，组织，检索等。

第三章  语料库

    语料库收集，整理，对齐，检索，基于语料库的知识获取。

第四章  词法分析

    正则语法与有限状态自动机，HMM与词性标注，汉语词语切分，未定义词识别等。

第五章  句法分析

    各种形式语法理论（短语结构语法，范畴语法，链语法，GB，LFG，HPSG等），句法分析算法（GLR，Chart，PCFG等），病句处理技术，汉语语法分析等。

第六章  语义分析

    语义网络，格框架，配价语法，词汇语义，形式语义学基础。

第七章  篇章分析

    脚本，规划，话语分析，话题跟踪与探测，向量空间模型技术。

第八章  语言生成

    自然语言生成的理论和技术。

第九章  应用系统

    机器翻译，自动文摘，信息检索，信息提取等。
中国科学院研究生院信息学院 硕士生课程 刘群教授主讲。
本课程为计算机软件与理论专业研究生的专业基础课。通过本课程的学习，使同学掌握计算语言学的基本理论，了解自然语言处理的常用模型和算法，初步具备从事相关领域研究工作的能力。
内容提要：

第一章  概论

    介绍计算语言学的研究对象，研究手段，学科特点，历史趋势等。

第二章  词典

    词典编纂，组织，检索等。

第三章  语料库

    语料库收集，整理，对齐，检索，基于语料库的知识获取。

第四章  词法分析

    正则语法与有限状态自动机，HMM与词性标注，汉语词语切分，未定义词识别等。

第五章  句法分析

    各种形式语法理论（短语结构语法，范畴语法，链语法，GB，LFG，HPSG等），句法分析算法（GLR，Chart，PCFG等），病句处理技术，汉语语法分析等。

第六章  语义分析

    语义网络，格框架，配价语法，词汇语义，形式语义学基础。

第七章  篇章分析

    脚本，规划，话语分析，话题跟踪与探测，向量空间模型技术。

第八章  语言生成

    自然语言生成的理论和技术。

第九章  应用系统

    机器翻译，自动文摘，信息检索，信息提取等。

        《计算语言学》讲义-中科院 刘群教授
       5 486浏览

        会员免费
      
matlab
大小：1KB
批量读取全部sheet内容，可指定，并对无效内容处理，提取所需数据并画图
批量读取全部sheet内容，可指定，并对无效内容处理，提取所需数据并画图

        matlab批量读取excel表格数据并处理画图
       5 1w+浏览

        会员免费
      
语料库
大小：11MB
我自己写的新闻解析器从网页中提取的，支持多页新闻，效果不错。
我自己写的新闻解析器从网页中提取的，支持多页新闻，效果不错。

        用于自然语言处理的语料库——新浪新闻
       5 318浏览

        会员免费
      
Py Torch是一个基于 Torch的 Python开源机器学习库，用于自然语言处理等应用程序。它主要由Facebook的人工智能小组开发，不仅能够实现强大的GPU加速，同时还支持动态神经网络，这点是现在很多主流框架如 TensorFlow都不支持的。 Py Torch提供了两个高级功能：1具有强大的GPU加速的张量计算（如 Numpy）2包含自动求导系统的深度神经网络除了 Facebook之外Twitter、GMU和 Salesforce等机构都采用了 Py Torch官方教程包含了 Py Torch介绍，安装教程；60分钟快速入门教程，可以迅速从小白阶段完成一个分类器模型

        PyTorch官方教程中文版.pdf
       0 3362浏览

        会员免费
      
matlab
大小：34MB
Matlab深度学习工具箱
Matlab深度学习工具箱

        Matlab深度学习工具箱
       0 2004浏览
免费
停用词
大小：21KB
“哈工大停用词词库”、“四川大学机器学习智能实验室停用词库”、百度停用词表“及网上各种资源整理去重后得到，包括一些数字及字符
“哈工大停用词词库”、“四川大学机器学习智能实验室停用词库”、百度停用词表“及网上各种资源整理去重后得到，包括一些数字及字符

        中文停用词表（共2694个）
       5 4448浏览

        会员免费
      
机器学习
大小：2MB
采用机器学习的方法进行自然语言处理，对中文进行分词和词性标注。分词采用crf模型，词性标注用hmm模型，解码算法为Vertibi算法。本系统使用java语言编写
采用机器学习的方法进行自然语言处理，对中文进行分词和词性标注。分词采用crf模型，词性标注用hmm模型，解码算法为Vertibi算法。本系统使用java语言编写

        可训练的中文分词和词性标注系统
       4 347浏览

        会员免费
      
Python开发-自然语言处理
大小：888KB
利用Python实现中文文本关键词抽取，分别采用TF-IDF、TextRank、Word2Vec词聚类三种方法。
利用Python实现中文文本关键词抽取，分别采用TF-IDF、TextRank、Word2Vec词聚类三种方法。

        Python-利用Python实现中文文本关键词抽取分别采用TFIDFTextRankWord2Vec词聚类三种方法
       5 7523浏览

        会员免费
      
PyTorch是一个基于Torch的Python开源机器学习库，用于自然语言处理等应用程序。它主要由Facebookd的人工智能小组开发，不仅能够 实现强大的GPU加速，同时还支持动态神经网络，这一点是现在很多主流框架如TensorFlow都不支持的。 PyTorch提供了两个高级功能： 1.具有强大的GPU加速的张量计算（如Numpy） 2.包含自动求导系统的深度神经网络 除了Facebook之外，Twitter、GMU和Salesforce等机构都采用了PyTorch。
官方教程包含了 PyTorch 介绍，安装教程；60分钟快速入门教程，可以迅速从小白阶段完成一个分类器模型；计算机视觉常用模型，方便基于自己的数据进行调整，不再需要从头开始写；自然语言处理模型，聊天机器人，文本生成等生动有趣的项目。

        pytorch中文文档.pdf
       0 1897浏览

        会员免费
      
词性标注
大小：2MB
词是最小的能够独立活动的有意义的语言成分,但汉语是以字为基本的书写单位，词语之间没有明显的区分标记，因此，中文词法分析是中文信息处理的基础与关键。为此,中国科学院计算技术研究所在多年研究基础上，耗时一年研制出了基于多层隐马模型的汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)，该系统的功能有：中文分词；词性标注；未登录词识别。分词正确率高达97.58%(最近的973专家组评测结果)，基于角色标注的未登录词识别能取得高于90%召回率，其中中国人名的识别召回率接近98%，分词和词性标注处理速度为543.5KB/s。 <br>计算所汉语词法分析系统ICTCLAS同时还提供一套完整的动态连接库ICTCLAS.dll,COM组件和相应的概率词典,开发者可以完全忽略汉语词法分析，直接在自己的系统中调用ICTCLAS，ICTCLAS可以根据需要输出多个高概率的结果，输出格式也可以定制，开发者在分词和词性标注的基础上继续上层开发。<br>    使用时请遵守《自然语言处理开放资源许可证》
词是最小的能够独立活动的有意义的语言成分,但汉语是以字为基本的书写单位，词语之间没有明显的区分标记，因此，中文词法分析是中文信息处理的基础与关键。为此,中国科学院计算技术研究所在多年研究基础上，耗时一年研制出了基于多层隐马模型的汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)，该系统的功能有：中文分词；词性标注；未登录词识别。分词正确率高达97.58%(最近的973专家组评测结果)，基于角色标注的未登录词识别能取得高于90%召回率，其中中国人名的识别召回率接近98%，分词和词性标注处理速度为543.5KB/s。 <br>计算所汉语词法分析系统ICTCLAS同时还提供一套完整的动态连接库ICTCLAS.dll,COM组件和相应的概率词典,开发者可以完全忽略汉语词法分析，直接在自己的系统中调用ICTCLAS，ICTCLAS可以根据需要输出多个高概率的结果，输出格式也可以定制，开发者在分词和词性标注的基础上继续上层开发。<br>    使用时请遵守《自然语言处理开放资源许可证》

        计算所汉语词法分析系统ICTCLAS
       5 421浏览

        会员免费
      
CRF
大小：772KB
这个是条件随机场的实现软件，可用于自然语言处理
这个是条件随机场的实现软件，可用于自然语言处理

        条件随机场CRF++0.58
       5 218浏览

        会员免费
      
人工智能
大小：10KB
资源名称：基于PyTorch实现的词向量模型

资源内容：
1. 英文文本数据集（1803个单词）
2. 其余代码
资源名称：基于PyTorch实现的词向量模型

资源内容：
1. 英文文本数据集（1803个单词）
2. 其余代码

        基于PyTorch实现的词向量模型
       0 1745浏览
免费
中文语料
大小：10MB
人民日报标注语料库(版本1.0，下面简称PFR语料库)是在得到人民日报社新闻信息中心许可的条件下，以1998年人民日报语料为对象，由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。该语料库对600多万字节的中文文章进行了分词及词性标注，其被作为原始数据应用于大量的研究和论文中。
人民日报标注语料库(版本1.0，下面简称PFR语料库)是在得到人民日报社新闻信息中心许可的条件下，以1998年人民日报语料为对象，由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。该语料库对600多万字节的中文文章进行了分词及词性标注，其被作为原始数据应用于大量的研究和论文中。

        人民日报1998年1月中文标注语料库
       4 1752浏览

        会员免费
      
软件/插件
大小：4MB
Notepad++ 8.5.6最新版 64位安装包

Notepad++是 Windows操作系统下的一套文本编辑器；

Notepad++是免费软件，可以免费使用，自带中文，支持众多计算机程序语言；
Notepad++ 8.5.6最新版 64位安装包

Notepad++是 Windows操作系统下的一套文本编辑器；

Notepad++是免费软件，可以免费使用，自带中文，支持众多计算机程序语言；

        Notepad++ 8.5.6最新版 64位安装包
       0 1123浏览

        会员免费
      
微信小程序
大小：5MB
chatgpt微信小程序源码
chatgpt微信小程序源码

        chatgpt微信小程序源码
       5 3129浏览
免费
Python开发-机器学习
大小：5MB
PyTorch是一个基于Torch的Python开源机器学习库，用于自然语言处理等应用程序。 它主要由Facebook的人工智能研究小组开发。Uber的"Pyro"也是使用的这个库。
PyTorch是一个基于Torch的Python开源机器学习库，用于自然语言处理等应用程序。 它主要由Facebook的人工智能研究小组开发。Uber的"Pyro"也是使用的这个库。

        Python-pytorch中文手册
       0 1506浏览

        会员免费
      
综合资源
大小：112MB
speechbrain中文预训练模型
speechbrain中文预训练模型

        speechbrain中文预训练模型
       1 1096浏览
免费
Python开发-自然语言处理
大小：18MB
爬取百度百科中文页面，抽取三元组信息，构建中文知识图谱
爬取百度百科中文页面，抽取三元组信息，构建中文知识图谱

        Python-爬取百度百科中文页面抽取三元组信息构建中文知识图谱
       4 3386浏览

        会员免费
      
腾讯新闻
大小：24MB
上学期自己下载的新闻，新闻时间是在2009年12月末
上学期自己下载的新闻，新闻时间是在2009年12月末

        自然语言处理---语料库
       5 292浏览

        会员免费
      
向量空间模型 权重计算方法
信息检索常用的方法
用于自然语言处理
可以适用于分类

        实用的tf-idf代码
       4 454浏览

        会员免费
      
统计自然语言
大小：3MB
全部都有<br>是一套完整的讲义
全部都有<br>是一套完整的讲义

        统计自然语言处理（完整版）
       4 191浏览

        会员免费
      
机器学习
大小：6MB
北京大学自然语言处理高级专题（机器学习）课件，以专题形式介绍了常用的机器学习算法，深入浅出。
注：内容为英文
北京大学自然语言处理高级专题（机器学习）课件，以专题形式介绍了常用的机器学习算法，深入浅出。
注：内容为英文

        北京大学自然语言处理高级专题（机器学习）课件
       5 375浏览

        会员免费
      
Python开发-自然语言处理
大小：3MB
本文基于Google开源的BERT代码进行了进一步的简化，方便生成句向量与做文本分类
本文基于Google开源的BERT代码进行了进一步的简化，方便生成句向量与做文本分类

        Python-BERT生成句向量BERT做文本分类文本相似度计算
       0 1w+浏览

        会员免费
      
数学基础 python基础 python高级应用 机器学习 深度学习 自然语言处理 图像处理 数据挖掘与项目  企业项目 等

        AI人工智能教学视频完整版
       1 2075浏览

        会员免费
      
数据集
大小：13KB
diabetes糖尿病数据集
diabetes糖尿病数据集

        diabetes糖尿病数据集
       0 810浏览
免费
自然语言的绝对经典，据说是google公司技术人员必读书籍，非常实用！

        自然语言绝对经典《统计自然语言处理基础》
       5 160浏览

        会员免费
      

          1
        

          2
        

          3
        

          4
        

          5
        

          50
        
前往
页