# 中文谣言数据
该数据为从新浪微博不实信息举报平台抓取的中文谣言数据,共包含截止至2017年6月13日的31669条谣言。
## 数据集介绍
该数据文件中,每一行为一条json格式的谣言数据,字段释义如下:
* **rumorCode**: 该条谣言的唯一编码,可以通过该编码直接访问该谣言举报页面。
* **title**: 该条谣言被举报的标题内容
* **informerName**: 举报者微博名称
* **informerUrl**: 举报者微博链接
* **rumormongerName**: 发布谣言者的微博名称
* **rumormongerUr**: 发布谣言者的微博链接
* **rumorText**: 谣言内容
* **visitTimes**: 该谣言被访问次数
* **result**: 该谣言审查结果
* **publishTime**: 该谣言被举报时间
## 引用
如果您使用该数据集,请引用以下论文:
* 中文:
```
@article{liu2015rumors,
title={中文社交媒体谣言统计语义分析},
author={刘知远 and 张乐 and 涂存超 and 孙茂松},
journal={中国科学: 信息科学},
volume={12},
pages={1536--1546},
year={2015}
}
```
* English:
```
@article{liu2015rumors,
title={Statistical and semantic analysis of rumors in Chinese social media},
author={Liu, Zhiyuan and Zhang, Le and Tu, Cunchao and Sun, Maosong},
journal={Scientia Sinica Informationis},
volume={45},
number={12},
pages={1536},
year={2015}
}
```
没有合适的资源?快使用搜索试试~ 我知道了~
NLP民工的乐园: 几乎最全的中文NLP资源库
共111个文件
txt:83个
jpg:4个
svg:4个
需积分: 0 0 下载量 133 浏览量
更新于2024-10-09
收藏 73.78MB ZIP 举报
在入门到熟悉NLP的过程中,用到了很多github上的包,遂整理了一下,分享在这里。
很多包非常有趣,值得收藏,满足大家的收集癖! 如果觉得有用,请分享并star:star:,谢谢!
长期不定时更新,欢迎watch和fork!:heart::heart::heart:
收起资源包目录
NLP民工的乐园: 几乎最全的中文NLP资源库 (111个子文件)
《中华人民共和国职业分类大典》.doc 1.24MB
.DS_Store 6KB
.DS_Store 6KB
.alipay.jpg 131KB
.wechat.jpg 101KB
.img.jpg 52KB
QQpinyin.jpg 7KB
rumors_v170613.json 32.57MB
reamde.md 135KB
README.md 1KB
donation.md 419B
eisenstein-nlp-notes.pdf 3.2MB
LLM_Survey_Chinese_0418.pdf 2.04MB
中文分词十年又回顾- 2007-2017 CWS-10Year-Review-2.pdf 1.42MB
thirtyw.py 365B
thirtyw.pyc 513B
Company-Names-Corpus(480W).rar 24.78MB
Organization-Names-Corpus(110W).rar 4.61MB
.Home-人生浪费指南-brightgreen.svg 1KB
.Citations-487-red.svg 1KB
.Citations-487-blueviolet.svg 1KB
.猎送门-CV-orange.svg 1KB
Chinese_Names_Corpus_Gender(120W).txt 16.13MB
Chinese_Names_Corpus(120W).txt 11.5MB
English_Cn_Name_Corpus_Gender(48W).txt 11.01MB
30wChinsesSeqDic.txt 7.18MB
English_Cn_Name_Corpus(48W).txt 5.55MB
30wChinsesSeqDic_clean.txt 3.8MB
30wdict_utf8.txt 3.04MB
30wdict.txt 3.04MB
Company-Shorter-Form(28W).txt 2.62MB
Ancient_Names_Corpus(25W).txt 2.51MB
Japanese_Names_Corpus(18W).txt 2.3MB
dict.txt 2.25MB
httpcws_dict.txt 2.22MB
四十万可用搜狗txt词库.txt 1.61MB
out.txt 1.58MB
四十万汉语大词库.txt 1.06MB
百度分词词库.txt 1006KB
同义词库.txt 872KB
42537条伪原创词库.txt 829KB
ChengYu_Corpus(5W).txt 709KB
THUOCL_diming.txt 626KB
fingerDic.txt 552KB
五笔词库.TXT 398KB
反义词库.txt 346KB
THUOCL_animal.txt 313KB
chaizi-ft.txt 313KB
chaizi-jt.txt 304KB
THUOCL_medical.txt 302KB
THUOCL_it.txt 301KB
THUOCL_poem.txt 288KB
THUOCL_law.txt 271KB
train_set.txt 255KB
English_Names_Corpus(2W).txt 230KB
professions.txt 186KB
THUOCL_chengyu.txt 163KB
THUOCL_lishimingren.txt 159KB
THUOCL_food.txt 141KB
fanjian_suoyin.txt 139KB
test_set.txt 74KB
THUOCL_caijing.txt 61KB
songci.txt 60KB
tangshi.txt 48KB
dev_set.txt 36KB
car_dict.txt 32KB
THUOCL_car.txt 32KB
否定词库.txt 26KB
haofang.txt 25KB
wanyue.txt 25KB
parting.txt 24KB
wind.txt 22KB
moon.txt 21KB
yongshihuaigu.txt 18KB
rain.txt 15KB
encouragement.txt 14KB
snow.txt 14KB
love.txt 14KB
flower.txt 12KB
patriotic.txt 12KB
miss.txt 11KB
expressemotion.txt 11KB
百度停用词表.txt 11KB
youguoyoumin.txt 10KB
friendship.txt 10KB
boudoirripinings.txt 9KB
landscape.txt 8KB
四川大学停用词表.txt 8KB
view.txt 8KB
willow.txt 8KB
countryside.txt 7KB
farewell.txt 7KB
frontier.txt 7KB
homesick.txt 6KB
哈工大停用词表.txt 6KB
bird.txt 6KB
中文停用词库.txt 5KB
war.txt 5KB
horse.txt 4KB
mourn.txt 4KB
共 111 条
- 1
- 2
资源推荐
资源预览
资源评论
190 浏览量
5星 · 资源好评率100%
173 浏览量
5星 · 资源好评率100%
172 浏览量
5星 · 资源好评率100%
169 浏览量
5星 · 资源好评率100%
194 浏览量
5星 · 资源好评率100%
5星 · 资源好评率100%
187 浏览量
122 浏览量
5星 · 资源好评率100%
176 浏览量
161 浏览量
2018-01-25 上传
5星 · 资源好评率100%
145 浏览量
5星 · 资源好评率100%
5星 · 资源好评率100%
109 浏览量
128 浏览量
5星 · 资源好评率100%
157 浏览量
2019-04-21 上传
5星 · 资源好评率100%
158 浏览量
2024-09-16 上传
5星 · 资源好评率100%
5星 · 资源好评率100%
5星 · 资源好评率100%
196 浏览量
179 浏览量
资源评论
jackl的科研日常
- 粉丝: 566
- 资源: 346
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 【教技·教育传播学】期末考试划重点
- SecureCRT8.5
- 船、无人机、汽车、人检测15-YOLO(v5至v9)、COCO、CreateML、Darknet、Paligemma、TFRecord、VOC数据集合集.rar
- 蓝凌OA系统 thirdimsyncforkkwebservice 任意文件读取漏洞分析及复现
- 基于Java语言校园快递代取系统的设计与实现+jsp(源码).rar
- 最全微信小程序开发100个案例
- 短视频创作工具,抖音黑科技,帮助短视频创作智能化、数据化、自动化,提升创作效能,让短视频创作更简单!
- 航空车辆检测8-YOLO(v5至v11)、COCO、CreateML、Paligemma、TFRecord、VOC数据集合集.rar
- AppleMusic微信小程序
- 识别纸质试卷上的表格,并通过OCR技术提取其中的内容-纸质试卷上表格识别与OCR技术提取内容-详细解释含代码解读
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功