没有合适的资源?快使用搜索试试~
我知道了~
文库首页
大数据
统计分析
简单的未清洗的微博评论数据
简单的未清洗的微博评论数据
数据集
需积分: 49
12 下载量
153 浏览量
2022-05-04
22:16:51
上传
评论
3
收藏
138KB
XLSX
举报
温馨提示
立即下载
选取知微数据平台2022年热点数据前五名 对微博评论区简单的数据爬取
资源推荐
资源评论
微博评论数据集.rar
浏览:39
3星 · 编辑精心推荐
微博评论数据集
微博评论数据集
浏览:37
内含微博评论数据集两个,一个是训练集,一个是测试集。
微博评论数据集7962条,其中包含积极和消极情感倾向
浏览:15
5星 · 资源好评率100%
微博评论数据集7962条,其中包含积极和消极情感倾向
微博评论情感数据集(清洗之后的,有标注,中文,csv格式).zip
浏览:130
5星 · 资源好评率100%
评论情感分类训练数据集,已完成清洗标注,分成四类,csv格式文档,二十万条数据清洗而成: 0:喜悦 1:愤怒 2:厌恶 3:低落
微博评论语料,4435960条数据
浏览:69
微博回复语料数据。微博是指一种基于用户关系信息分享、传播以及获取的通过关注机制分享简短实时信息的广播式的社交媒体、网络平台,允许用户通过Web、Wap、Mail、App、IM、SMS以及用户可以通过PC、手机等多种移动终端接入,以文字、图片、视频等多媒体形式,实现信息的即时分享、传播互动。
python微博数据清洗过滤微博数据处理
浏览:94
# 过滤文本中的html链接等 # 提取微博中的话题名称#和人名@ # 分词 #去除停用词 # 表情处理
84168条新浪微博数据集
浏览:108
84168条新浪微博数据集。 8万多条在2014-05-03至2014-05-11采集的关于12个主题的微博信息数据。包含63641个用户,文件为sql脚本,可直接导入数据库。 微博数据集 话题聚类
新浪微博2013年4月14日至4月16日实时数据集(剔除了小号和微博内容噪音)
浏览:103
5星 · 资源好评率100%
新浪微博2013年4月14日12:00至4月16:日12:00的实时数据。已经剔除了小号并且对微博内容进行了一定的过滤。数据集可以用来进行数据挖掘的实验等。数据可以直接导入mysql数据库使用
微博评论文本分类(完整数据和代码)
浏览:171
5星 · 资源好评率100%
环境 python 3.6.12 pytorch 1.6.0 tqdm sklearn tensorboardX 中文数据集 ChineseNlpCorpus中属于情感/观点/评论倾向性分析的微博评论数据集weibo_senti_100k 该数据集包含119988条带情感标注的新浪微博评论数据,其中正向评论占59993条,负向评论占59995条 类别:negitive,positive 效果
导出微博评论数据
浏览:90
4星 · 用户满意度95%
导出微博评论数据,本绿色软件可完全导出您在新浪微博所发布的任何消息,可保存为多种文件格式!
简单数据清洗python代码
浏览:22
简单试水……
wangju_spider:王菊微博评论数据抓取
浏览:90
最近一段时间,创造101很火,这个火是可以理解的,毕竟中国首部女团节目。但是还有一个人不知道为啥突然也火了,那就是我们的菊姐。关于菊姐为什么会火,网上有很多发文,这里就不再赘述了。 今天我们就来做一份菊粉陶渊明的用户画像,看看那些pick菊姐的人都有什么特质? 先来看看百度指数,通过百度指数我们看出,菊姐的搜索热度在5月30开始出现顶峰,5月31开始回落。 再来看看微信指数,与百度指数趋势一本一致
NLP:微博用户评论情感分析(数据规模20w).zip
浏览:36
5星 · 资源好评率100%
微博用户评论情感分析python代码,完整的可运行的,(数据规模20w)微博用户评论情感分析python代码,完整的可运行的
微博情感分析评测数据,微博评论情感分析,Python
浏览:125
5星 · 资源好评率100%
微博情感分析语料集,适用于做NLP情感分析
微博情感分析数据集
浏览:19
4星 · 用户满意度95%
微博情感200万条数据集,情感分析研究人员的很好的实验数据
微博最新数据集
浏览:194
4星 · 用户满意度95%
微博最新数据集,包含以下字段发表时间 所用设备 微博内容 点赞数 评论数 转发数 用户id 用户名称 vip等级 关注数 粉丝数 性别 微博认证(简介) 等级 阳光信用 注册时间
中文评论情感分析数据集
浏览:194
谭松波中文评论情感分析,1为正向情感,0为负向情感,
微博用户评论情感分析python代码(数据规模20w)
浏览:124
3星 · 编辑精心推荐
完整可运行的python代码。 数据过滤,清洗,分割,特征选择,训练词向量模型,测试等等, 每行都有注释,真实的数据集超过20w条,是个不错的nlp入门例子。
8万多条新浪微博数据集
浏览:58
5星 · 资源好评率100%
8万多条在2014-05-03至2014-05-11采集的关于12个主题的微博信息数据。文件为sql脚本,方便直接导入数据库。
微博情感分析评测数据,微博评论情感分析,Python源码.zip.zip
浏览:66
微博情感分析评测数据,微博评论情感分析,Python源码.zip.zip
weibo_comment:新浪微博的评论数据抓取和分析
浏览:172
weibo_comment 使用 nodejs 开发的 基于新浪微博开放平台的评论数据设备分析系统 快速开始 npm install node xx.js 注意 1、 访问新浪微博的数据接口需要 使用OAuth 2.0 的授权机制,获取到 access_token 详细: 我会在另外一篇博客介绍,非线上的环境怎么使用微博的认证授权机制,开发者在本地就可以访问微博API 2、 评论抓取的ap
weibo-comments-word-cloud:微博评论爬虫+评论html tag清洗+中文词云生成
浏览:2
weibo-comments-word-cloud Generates a Chinese word-cloud with the comments data crawled from WeiBo. 根据微博评论生成词云。 Steps: A crawler that crawles comments from Weibo 一个抓取微博评论的爬虫。 Data Cleaning. 数据清洗。 Gen
微博用户评论数据集 微博用户评论数据集
浏览:44
5星 · 资源好评率100%
用于文本分类 数据分析 关键词提取 数据详情:https://www.bilibili.com/video/BV1YL411d7V1/?spm_id_from=333.999.0.0&vd_source=8f3cf4ad6c08a40d40ca6809c9c9e8ca
17-数据清洗-清洗电商评论数据1
浏览:14
二、解析Json通过爬虫,我们可以得到一些Json形式的数据文件 三、搭建解析框架1. 准备hadoop2lib.tar.gz和fastjson-1.2.31.
十万微博数据集.rar
浏览:187
爬取的103个微博用户截止2019年8月发布的所有原创微博,以csv文件存储,每个用户对应一个csv文件。包括48位女性,55位男性,男女性分开存储。包括id、微博正文、微博原始图片URL、原始视频URL、发布日期、发布工具、点赞数、评论数、转发数、话题和@用户。总共包括十多万条微博,可以用做性别分类等自然语言处理任务的数据集。
COAE2013评测数据集微博情感分析
浏览:194
3星 · 编辑精心推荐
COAE2013评测数据集微博情感分析,标注好情感极性等的数据
微博数据爬取demo ,解析微博评论数,点赞数,图片链接等
浏览:125
微博数据爬取demo ,解析微博评论数,点赞数,图片链接等
Python金融量化的高级库:TA-Lib-0.4.24(包含python3.7、3.8、3.9、3.10的32位和64位版本)
浏览:112
TA-Lib(Technical Analysis Library, 即技术分析库)是Python金融量化的高级库,涵盖了150多种股票、期货交易软件中常用的技术分析指标,如MACD、RSI、KDJ、动量指标、布林带等。但很多人安装指标计算ta-lib库就总报错,就可以在这里找到包下载后安装。 文件举例:TA_Lib‑0.4.24‑cp37‑cp37m‑win_amd64.whl 命名解释:包名
xthreg2命令安装包
浏览:110
5星 · 资源好评率100%
门槛回归 门限回归 stata 门槛面板 门槛回归(Threshold Regression)是一种非线性回归方法,它假设因变量在自变量上存在一个或多个阈值,当自变量超过或达到这个阈值时,因变量的变化发生了显著的跃迁。因此,门槛回归可以用来分析因变量对于自变量的非线性响应,特别是当因变量的响应在某个阈值点发生了显著变化时。 门限回归(Tobit Regression)是一种特殊的门槛回归方法,它
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
宵夜的名字
粉丝: 0
资源:
1
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
华为HCIA-WLAN 3.0 课程视频(21 基本配置命令与案例解析.mp4)
附件1:HR-HR-T-009 试用期员工考核表-更新 沪.xlsx
Snap7工具,用于模拟西门子PLC的S7协议的通信数据,博客中用到,故上传该资源
附件3:员工试用期小结 沪.doc
Vue.js入门教程.pdf
单片机 16通道PWM伺服驱动器PCB Eagle文件
Go语言入门教程.pdf
关于如何快速入手Kotlin
ALTIUM库 常用电阻电容芯片类2D3D PCB封装库AD库(2D3D封装库).zip
keil5安装教程keil5安装教程
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功