# 中文谣言数据
该数据为从新浪微博不实信息举报平台抓取的中文谣言数据,共包含截止至2017年6月13日的31669条谣言。
## 数据集介绍
该数据文件中,每一行为一条json格式的谣言数据,字段释义如下:
* **rumorCode**: 该条谣言的唯一编码,可以通过该编码直接访问该谣言举报页面。
* **title**: 该条谣言被举报的标题内容
* **informerName**: 举报者微博名称
* **informerUrl**: 举报者微博链接
* **rumormongerName**: 发布谣言者的微博名称
* **rumormongerUr**: 发布谣言者的微博链接
* **rumorText**: 谣言内容
* **visitTimes**: 该谣言被访问次数
* **result**: 该谣言审查结果
* **publishTime**: 该谣言被举报时间
## 引用
如果您使用该数据集,请引用以下论文:
* 中文:
```
@article{liu2015rumors,
title={中文社交媒体谣言统计语义分析},
author={刘知远 and 张乐 and 涂存超 and 孙茂松},
journal={中国科学: 信息科学},
volume={12},
pages={1536--1546},
year={2015}
}
```
* English:
```
@article{liu2015rumors,
title={Statistical and semantic analysis of rumors in Chinese social media},
author={Liu, Zhiyuan and Zhang, Le and Tu, Cunchao and Sun, Maosong},
journal={Scientia Sinica Informationis},
volume={45},
number={12},
pages={1536},
year={2015}
}
```
没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
收起资源包目录
NLP民工的乐园: 几乎最全的中文NLP资源库 (111个子文件)
《中华人民共和国职业分类大典》.doc 1.24MB
.DS_Store 6KB
.DS_Store 6KB
.alipay.jpg 131KB
.wechat.jpg 101KB
.img.jpg 52KB
QQpinyin.jpg 7KB
rumors_v170613.json 32.57MB
reamde.md 135KB
README.md 1KB
donation.md 419B
eisenstein-nlp-notes.pdf 3.2MB
LLM_Survey_Chinese_0418.pdf 2.04MB
中文分词十年又回顾- 2007-2017 CWS-10Year-Review-2.pdf 1.42MB
thirtyw.py 365B
thirtyw.pyc 513B
Company-Names-Corpus(480W).rar 24.78MB
Organization-Names-Corpus(110W).rar 4.61MB
.Home-人生浪费指南-brightgreen.svg 1KB
.Citations-487-red.svg 1KB
.Citations-487-blueviolet.svg 1KB
.猎送门-CV-orange.svg 1KB
Chinese_Names_Corpus_Gender(120W).txt 16.13MB
Chinese_Names_Corpus(120W).txt 11.5MB
English_Cn_Name_Corpus_Gender(48W).txt 11.01MB
30wChinsesSeqDic.txt 7.18MB
English_Cn_Name_Corpus(48W).txt 5.55MB
30wChinsesSeqDic_clean.txt 3.8MB
30wdict_utf8.txt 3.04MB
30wdict.txt 3.04MB
Company-Shorter-Form(28W).txt 2.62MB
Ancient_Names_Corpus(25W).txt 2.51MB
Japanese_Names_Corpus(18W).txt 2.3MB
dict.txt 2.25MB
httpcws_dict.txt 2.22MB
四十万可用搜狗txt词库.txt 1.61MB
out.txt 1.58MB
四十万汉语大词库.txt 1.06MB
百度分词词库.txt 1006KB
同义词库.txt 872KB
42537条伪原创词库.txt 829KB
ChengYu_Corpus(5W).txt 709KB
THUOCL_diming.txt 626KB
fingerDic.txt 552KB
五笔词库.TXT 398KB
反义词库.txt 346KB
THUOCL_animal.txt 313KB
chaizi-ft.txt 313KB
chaizi-jt.txt 304KB
THUOCL_medical.txt 302KB
THUOCL_it.txt 301KB
THUOCL_poem.txt 288KB
THUOCL_law.txt 271KB
train_set.txt 255KB
English_Names_Corpus(2W).txt 230KB
professions.txt 186KB
THUOCL_chengyu.txt 163KB
THUOCL_lishimingren.txt 159KB
THUOCL_food.txt 141KB
fanjian_suoyin.txt 139KB
test_set.txt 74KB
THUOCL_caijing.txt 61KB
songci.txt 60KB
tangshi.txt 48KB
dev_set.txt 36KB
car_dict.txt 32KB
THUOCL_car.txt 32KB
否定词库.txt 26KB
haofang.txt 25KB
wanyue.txt 25KB
parting.txt 24KB
wind.txt 22KB
moon.txt 21KB
yongshihuaigu.txt 18KB
rain.txt 15KB
encouragement.txt 14KB
snow.txt 14KB
love.txt 14KB
flower.txt 12KB
patriotic.txt 12KB
miss.txt 11KB
expressemotion.txt 11KB
百度停用词表.txt 11KB
youguoyoumin.txt 10KB
friendship.txt 10KB
boudoirripinings.txt 9KB
landscape.txt 8KB
四川大学停用词表.txt 8KB
view.txt 8KB
willow.txt 8KB
countryside.txt 7KB
farewell.txt 7KB
frontier.txt 7KB
homesick.txt 6KB
哈工大停用词表.txt 6KB
bird.txt 6KB
中文停用词库.txt 5KB
war.txt 5KB
horse.txt 4KB
mourn.txt 4KB
共 111 条
- 1
- 2
资源评论
jackl的科研日常
- 粉丝: 96
- 资源: 29
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- COMSOL裂隙动水注浆扩散数值模 拟针对动水注浆中常用的2种速凝浆液,水泥–水玻璃浆液与高聚物改性水泥浆液,考虑浆液黏度时变
- 106随机优化智能配电网的双时间尺度随机优化调度matlab.rar
- 2档AMT纯电动汽车(EV),运行良好,含说明文件,以前做开发买的量产模型,可用于WLTC,NEDC等多种工况仿真,可用于动力性
- 暴风电视电视刷机数据 65X3 屏V650DJ4-QS5 机编60000AM0H00 屏参30172604 V1.0.87版本
- comsol钻孔流固耦合案例
- 108 Python一种新的需求响应机制DR-VCG研究.rar
- 文库转-企业级IT运维服务体系设计方案
- COMSOL案例,非均质储层的地热能群井抽采 适用于做地热能开采,模型为非均质模型,利用地质统计学模拟得到储层的非均质性,加载到
- COMSOL流沙层注浆数值模拟研究 案例 本模型来源于文献复现,该文献分析了流沙层地质结构特点,应用有限元分析软件COMSOL
- 暴风电视电视刷机数据 65X3 屏V650DJ4-QS5 机编60000AM0H00 屏参30172604 V1.0.85版本
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功