没有合适的资源?快使用搜索试试~ 我知道了~
nlp-datasets:用于自然语言处理(NLP)的带有文本数据的自由公共领域数据集的字母顺序列表
共1个文件
md:1个
需积分: 10 2 下载量 112 浏览量
2021-02-24
10:00:13
上传
评论
收藏 9KB ZIP 举报
温馨提示
nlp数据集 自由/公共领域数据集的字母顺序列表,其中包含用于自然语言处理(NLP)的文本数据。 如果您正在寻找带注释的语料库或树库,请参阅底部的源,此处的大多数内容只是原始的非结构化文本数据。 数据集(英语,多语言) :截至2011年7月11日的所有公共可用Apache Software Foundation邮件档案(200 GB) :包括2004年8月从blogger.com收集的19,320个博客作者的帖子。681,288个帖子和超过1.4亿个单词。 (298 MB) 由568454条食品评论亚马逊用户留给了2012年10月。 (240 MB) :斯坦福大学收藏了3500万条亚马逊评论。 (11 GB) :存档的所有论文均为全文(270 GB)+源文件(190 GB)。 人物按内容分类的社交媒体消息。 (4 MB) :两种类型的学生文章的年度扩展语料库:论文和评论。
资源推荐
资源详情
资源评论
收起资源包目录
nlp-datasets-master.zip (1个子文件)
nlp-datasets-master
README.md 22KB
共 1 条
- 1
资源评论
晨曦姜
- 粉丝: 57
- 资源: 4661
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Win64OpenSSL-3-3-0.exe
- 课高分程设计-基于C++实现的民航飞行与地图简易管理系统-南京航空航天大学
- 航天器遥测数据故障检测系统python源码+文档说明+数据库(课程设计)
- 北京航空航天大学操作系统课设+ppt+实验报告
- 基于Vue+Echarts实现风力发电机中传感器的数据展示监控可视化系统+源代码+文档说明(高分课程设计)
- 基于单片机的风力发电机转速控制源码
- 基于C++实现的风力发电气动平衡监测系统+源代码+测量数据(高分课程设计)
- 毕业设计- 基于STM32F103C8T6 单片机,物联网技术的太阳能发电装置+源代码+文档说明+架构图+界面截图
- 基于 LSTM(长短期记忆)(即改进的循环神经网络)预测风力发电厂中风力涡轮机产生的功率+源代码+文档说明
- 基于stm32f103+空心杯电机+oled按键+运动算法
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功