【完整视频教程】东财股吧、新浪财经爬虫，情感分析并自动生成发送舆情分析报告.zip

共30个文件

py：11个

txt：6个

xml：3个

版权申诉

爬虫

python

数据收集

5星 · 超过95%的资源 116 浏览量 2024-03-01 12:29:27 上传评论 1 收藏 7.93MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

【完整视频教程】东财股吧、新浪财经爬虫，情感分析并自动生成发送舆情分析报告.zip （30个子文件）

SJT-code

tools

ua.py 1KB

config.py 365B

spider

sina_finance.py 2KB

eastmoney_guba.py 3KB

ua_struc.png 45KB

main.py 570B

sina_struc.png 80KB

guba_struc.png 183KB

ua_pool.sql 50.94MB

.idea

finance_analysis_edu.iml 284B

misc.xml 185B

inspectionProfiles

profiles_settings.xml 174B

modules.xml 292B

.gitignore 182B

docs

pics

news_pie.jpg 15KB

guba_pie.jpg 15KB

舆情分析报告.docx 70KB

sentiment

dict_analysis.py 4KB

snownlp_analysis.py 106B

README.md 3KB

data_process

email_send.py 1019B

whole_process.py 700B

score_store.py 2KB

report_generate.py 18KB

dict

程度副词.txt 2KB

financial_sentiment_score.txt 110KB

否定词.txt 482B

新停用词.txt 9KB

停用词.txt 9KB

BosonNLP_sentiment_score.txt 2.41MB

# financial-spider-data-analysis # 金融爬虫与数据分析本项目功能为爬取指定股票的新浪财经数据与东方财富股吧舆论数据，作情感分析与数据分析后，自动生成docx格式分析报告，并发送至指定邮箱。本项目录制了配套视频讲解教程，发布在b站上，地址为： 1. 爬虫部分：https://www.bilibili.com/video/BV19D4y1g7Yp/ 2. 数据分析与存储部分：https://www.bilibili.com/video/BV1is4y1V7mw/ 3. 报告分析与邮件发送部分：https://www.bilibili.com/video/BV1CM4y1B7xx/ ## 使用方法 ### 本地运行在执行程序前，需要在以下文件中配置相关参数： - tools/config.py ``` import pymysql class MyMysql: def __init__(self): self.connect = pymysql.connect( host=Mysql服务IP地址, port=Mysql数据库端口, user=数据库用户名, password=数据库密码, database=数据库名, charset='utf8' ) self.cursor = self.connect.cursor() ``` 其中，数据库应按照如下结构建立： ![image](https://github.com/Anton-Mu/finance_spider_data_analysis/blob/main/guba_struc.png) ![image](https://github.com/Anton-Mu/finance_spider_data_analysis/blob/main/sina_struc.png) ![image](https://github.com/Anton-Mu/finance_spider_data_analysis/blob/main/ua_struc.png) 其中，数据库ua_pool为用于生成随机请求头user_agent的库，需要在建立完成数据库后导入位于文件根目录下的```ua_pool.sql```文件数据。如果需要实现邮件发送功能，则还需要配置如下参数： - data_process/email_send.py ``` import smtplib from email.mime.application import MIMEApplication from email.mime.text import MIMEText from email.mime.multipart import MIMEMultipart def send_email(): user = '发件人邮箱@qq.com' pwd = 'QQ邮箱的SMTP授权码' to = '收件人邮箱@qq.com' ... ``` 在完成上述配置后，运行```data_process/whole_process.py```即可自动开始爬取分析，并生成分析报告。分析报告位于```docs```文件夹下。修改该文件中```process_data```函数参数为其他股票代码，即可对其他指定股票进行爬取分析工作。例如，对于隆基股份则应在```data_process/whole_process.py```中执行 ``` process_data('sh601012') ``` ### 服务器部署该部分说明后续更新。 ## 注意事项 1. 搭建数据库时应与上述图片内结构相同。由于数据库查重功能部分依赖数据库中键的设置实现，因此改变结构可能导致程序部分功能出错。 2. 数据爬取分析与报告生成的运行最佳时间为晚间18:00-23:00间，数据采集相对更加全面有效。 3. 如果手动高频爬取东方财富股吧数据，可能导致服务器暂时封禁ip。可以自行挂代理或者等待一段时间后再次尝试。

评论收藏

内容反馈

版权申诉