包含微博爬虫、LDA主题分析、情感分析、时空协同分析四个部分。
流程图
![总体流程图](https://github.com/user-attachments/assets/e1483fac-8dc4-49ab-8256-e3311706c932)
1.微博爬虫
实现微博评论爬取和微博用户信息爬取,一天大概十万条。
![image](https://user-images.githubusercontent.com/58450966/147920881-f8e6f6ea-b389-417b-b13f-5d60829ecf40.png)
![image](https://user-images.githubusercontent.com/58450966/147920969-56bd4164-5599-4ecc-9918-55a42ab37b63.png)
2.LDA主题分析
实现文档主题抽取,包括数据清洗及分词、主题数的确定(主题一致性和困惑度)和最优主题模型的选择(暴力搜索)。
![image](https://user-images.githubusercontent.com/58450966/147921016-4f4bd003-4c68-4d51-82e3-eb5e14433960.png)
3.情感分析
实现评论文本的情感值计算,准确率超过97%,处于0到1之间。
![image](https://user-images.githubusercontent.com/58450966/147921147-90cd3019-a47f-496d-a783-b43d09aa1550.png)
![image](https://user-images.githubusercontent.com/58450966/147921200-db688b8e-2941-4a19-9aaa-aeabb3d9bab2.png)
4.话题热度计算
实现话题的热度的计算,同一时间内总和为1.
![image](https://user-images.githubusercontent.com/58450966/147921229-08e7ffea-c953-4efa-b52e-cdff40c615cc.png)
5.主题相似度计算
实现两个相邻时间片的话题的演化探测,以判断主题演化情况。
![image](https://user-images.githubusercontent.com/58450966/147921312-0917b2bf-d1ff-4076-933f-cb126f0fef16.png)
6.地图绘制
实现分省市情感均值、评论总数、新增确诊人数的地图可视化。
![{%F0EED5 @H@P5 1UKV~R4](https://user-images.githubusercontent.com/58450966/156149916-d1334422-3df7-416c-b9d5-317fd81323e4.png)
## Star History
[![Star History Chart](https://api.star-history.com/svg?repos=stay-leave/weibo-public-opinion-analysis&type=Date)](https://star-history.com/#stay-leave/weibo-public-opinion-analysis&Date)
没有合适的资源?快使用搜索试试~ 我知道了~
基于微博数据的舆情分析项目(包括微博爬虫、LDA主题分析和情感分析)高分项目
共39个文件
py:23个
md:7个
txt:7个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 118 浏览量
2024-12-26
08:50:02
上传
评论
收藏 16.16MB ZIP 举报
温馨提示
基于微博数据的舆情分析项目(包括微博爬虫、LDA主题分析和情感分析)高分项目,本资源中的源码都是经过本地编译过可运行的,评审分达到98分,资源项目的难度比较适中,内容都是经过助教老师审定过的能够满足学习、毕业设计、期末大作业和课程设计使用需求,如果有需要的话可以放心下载使用。 基于微博数据的舆情分析项目(包括微博爬虫、LDA主题分析和情感分析)高分项目基于微博数据的舆情分析项目(包括微博爬虫、LDA主题分析和情感分析)高分项目基于微博数据的舆情分析项目(包括微博爬虫、LDA主题分析和情感分析)高分项目基于微博数据的舆情分析项目(包括微博爬虫、LDA主题分析和情感分析)高分项目基于微博数据的舆情分析项目(包括微博爬虫、LDA主题分析和情感分析)高分项目基于微博数据的舆情分析项目(包括微博爬虫、LDA主题分析和情感分析)高分项目基于微博数据的舆情分析项目(包括微博爬虫、LDA主题分析和情感分析)高分项目基于微博数据的舆情分析项目(包括微博爬虫、LDA主题分析和情感分析)高分项目基于微博数据的舆情分析项目(包括微博爬虫、LDA主题分析和情感分析)高分项目基于微博数据的舆情分析项目(包括微博
资源推荐
资源详情
资源评论
收起资源包目录
资料代码.zip (39个子文件)
-main
heat calculation
热度_1.py 2KB
热度_2.py 673B
热度_3.py 2KB
Readme.md 189B
topic similarity
w2v.model 17.65MB
word2vc.py 587B
主题余弦相似度.py 3KB
Readme.md 306B
map
Number of new employees.py 1KB
Emotional mean.py 2KB
新增.xlsx 11KB
Comment mean.py 2KB
Readme.md 539B
emotional analysis
多日期降维.py 514B
负向语料.txt 134KB
情感分析_API版.py 5KB
修改日期格式.py 2KB
情感分析_SDK版.py 3KB
折线图绘制.py 1KB
正向比重.py 3KB
README.md 756B
正向语料.txt 35KB
weibo-crawler
data cleaning.py 9KB
comment crawler.py 6KB
comments-crawler_random.py 7KB
停用词表.txt 24KB
comments-crawler_random(仅针对去年的评论).py 7KB
README.md 2KB
user information crawler.py 4KB
requirement.txt 79B
README.md 2KB
LDA
自建词表.txt 80KB
近义词表.txt 179B
分词处理.py 3KB
LDA+超参.py 8KB
excelתtxt.py 4KB
停用词表.txt 24KB
README.md 240B
LDA.py 5KB
共 39 条
- 1
资源评论
盈梓的博客
- 粉丝: 9610
- 资源: 2331
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功