环境:Python3.6
包含微博爬虫、LDA主题分析和情感分析三个部分。
新增话题热度、话题相似度部分。
新增地图可视化部分,数据由团队自行搜集。
1.微博爬虫
实现微博评论爬取和微博用户信息爬取,一天大概十万条。
![image](https://user-images.githubusercontent.com/58450966/147920881-f8e6f6ea-b389-417b-b13f-5d60829ecf40.png)
![image](https://user-images.githubusercontent.com/58450966/147920969-56bd4164-5599-4ecc-9918-55a42ab37b63.png)
2.LDA主题分析
实现文档主题抽取,包括数据清洗及分词、主题数的确定(主题一致性和困惑度)和最优主题模型的选择(暴力搜索)。
![image](https://user-images.githubusercontent.com/58450966/147921016-4f4bd003-4c68-4d51-82e3-eb5e14433960.png)
3.情感分析
实现评论文本的情感值计算,准确率超过97%,处于0到1之间。
![image](https://user-images.githubusercontent.com/58450966/147921147-90cd3019-a47f-496d-a783-b43d09aa1550.png)
![image](https://user-images.githubusercontent.com/58450966/147921200-db688b8e-2941-4a19-9aaa-aeabb3d9bab2.png)
4.话题热度计算
实现话题的热度的计算,同一时间内总和为1.
![image](https://user-images.githubusercontent.com/58450966/147921229-08e7ffea-c953-4efa-b52e-cdff40c615cc.png)
5.主题相似度计算
实现两个相邻时间片的话题的演化探测,以判断主题演化情况。
![image](https://user-images.githubusercontent.com/58450966/147921312-0917b2bf-d1ff-4076-933f-cb126f0fef16.png)
6.地图绘制
实现分省市情感均值、评论总数、新增确诊人数的地图可视化。
![{%F0EED5 @H@P5 1UKV~R4](https://user-images.githubusercontent.com/58450966/156149916-d1334422-3df7-416c-b9d5-317fd81323e4.png)
## Star History
[![Star History Chart](https://api.star-history.com/svg?repos=stay-leave/weibo-public-opinion-analysis&type=Date)](https://star-history.com/#stay-leave/weibo-public-opinion-analysis&Date)
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【作品名称】:基于微博数据的舆情分析项目,包括微博爬虫、LDA主题分析和情感分析 【适用人群】:适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 【项目介绍】: 环境:Python3.6 包含微博爬虫、LDA主题分析和情感分析三个部分。 新增话题热度、话题相似度部分。 新增地图可视化部分,数据由团队自行搜集。 1.微博爬虫 实现微博评论爬取和微博用户信息爬取,一天大概十万条。 2.LDA主题分析 实现文档主题抽取,包括数据清洗及分词、主题数的确定(主题一致性和困惑度)和最优主题模型的选择(暴力搜索)。 6.地图绘制 实现分省市情感均值、评论总数、新增确诊人数的地图可视化。 【资源声明】:本资源作为“参考资料”而不是“定制需求”,代码只能作为参考,不能完全复制照搬。需要有一定的基础看懂代码,自行调试代码并解决报错,能自行添加功能修改代码。
资源推荐
资源详情
资源评论
收起资源包目录
weibo-public-opinion.zip (39个子文件)
weibo-public-opinion
heat calculation
热度_1.py 2KB
热度_2.py 673B
热度_3.py 2KB
Readme.md 189B
topic similarity
w2v.model 17.65MB
word2vc.py 587B
主题余弦相似度.py 3KB
Readme.md 306B
map
Number of new employees.py 1KB
Emotional mean.py 2KB
新增.xlsx 11KB
Comment mean.py 2KB
Readme.md 539B
emotional analysis
多日期降维.py 514B
负向语料.txt 134KB
情感分析_API版.py 5KB
修改日期格式.py 2KB
情感分析_SDK版.py 3KB
折线图绘制.py 1KB
正向比重.py 3KB
README.md 756B
正向语料.txt 35KB
weibo-crawler
data cleaning.py 9KB
comment crawler.py 6KB
comments-crawler_random.py 7KB
停用词表.txt 24KB
comments-crawler_random(仅针对去年的评论).py 7KB
README.md 2KB
user information crawler.py 4KB
requirement.txt 79B
README.md 2KB
LDA
自建词表.txt 80KB
近义词表.txt 179B
分词处理.py 3KB
excel转txt.py 4KB
LDA+超参.py 8KB
停用词表.txt 24KB
README.md 240B
LDA.py 5KB
共 39 条
- 1
资源评论
小英子架构
- 粉丝: 1010
- 资源: 4042
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- MATLAB 图像处理:自动检测黑白像素比例的多功能代码(支持灰度和二值图像)
- windows平台下终端工具-tabby
- STM32和ucosii系统温度监控系统keil5工程
- HIVE-14706.01.patch
- C# WInForm IrisSkin2皮肤控件
- svn cleanup 失败怎么办
- Spring Boot集成Spring Security,HTTP请求授权配置:包含匿名访问、允许访问、禁止访问配置
- 易语言-画曲线模块及应用例程
- 电子元件行业知名厂商官网(TI/NXP/ST/Infineon/ADI/Microchip/Qualcomm/Diodes/Panasonic/TDK/TE/Vishay/Molex等)数据样例
- Cytoscape-3-10-0-windows-64bit.exe
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功