[![996.icu](https://img.shields.io/badge/link-996.icu-red.svg)](https://996.icu)
### Real_Time_DataMining_Sortware
[![Stargazers over time](https://starchart.cc/CarryChang/Real_Time_DataMining_Software.svg)](https://starchart.cc/CarryChang/Real_Time_DataMining_Software)
#### [视频演示demo](https://github.com/CarryChang/C-CNN-for-Chinese-Sentiment-Analysis/blob/master/video/demo.mp4)
#### 一款能实时进行文本挖掘的软件,不占用多余的存储空间,直接将采集后的数据集中存储在本地txt中,运用本软件无需进行大量的手动翻页操作,输入对应的店铺链接即可对民宿进行分析包含接结构化数据的可视化和非结构化UGC的情感分析,包含数据的实时采集/数据清洗/结构化保存/UGC数据主题提取/情感分析/后结构化可视化等技术的综合性演示demo。基于在线民宿UGC数据的意见挖掘项目,包含数据挖掘和NLP相关的处理,负责数据采集、整句切分、主题抽取、情感分析等任务。主要克服用户打分和评论不一致,实时对携程和美团在线民宿的满意度进行评测以及对额外数据进行可视化的综合性工具,多维度的对在线UGC进行数据挖掘并可视化,对比顾客直接打分的结果来看,运用机器学习的情感分析方法更能挖掘到详细的顾客意见和对应的合理评分。
##### 软件包含数据采集(txt_analysis/spiders)/清理/可视化(txt_analysis/picturing)部分组成,直接运行Python3 RealTime_UGC_Analysis_GUI.py 即可打开本软件的GUI界面,缺失的库按照提示进行安装即可。
<div align=center><img src="https://github.com/CarryChang/Real_Time_DataMining_Sortware/blob/master/pic/GUI_main.png"></div>
##### 主要功能包括美团/携程在线民宿UGC的原始评论采集、主题分类、实时数据清洗、文本情感分析与后结构化结果可视化展示等模块。
> 1. 使用Request模拟浏览实现了美团/携程民宿的实时自动化的采集民宿UGC内容的功能,提取后的民宿地址和在线评论等信息如下。
<div align=center><img src="https://github.com/CarryChang/Real_Time_DataMining_Sortware/blob/master/pic/meituan.png"></div>
<div align=center><img src="https://github.com/CarryChang/Real_Time_DataMining_Sortware/blob/master/pic/data_collector.png"></div>
> 2. 单一的UGC情感分析,使用清洗后的用户打分进行标注然后训练的分类模型,然后对切分后的UGC进行分类。
<div align=center><img src="https://github.com/CarryChang/Real_Time_DataMining_Sortware/blob/master/pic/best_comment_analysis.png"></div>
> 3. 对提取后的民宿主题进行UGC主题情感分析:如环境
<div align=center><img src="https://github.com/CarryChang/Real_Time_DataMining_Sortware/blob/master/pic/environment_analysis.png"></div>
> 4. 提取UGC标签,并进行量化可视化
<div align=center><img src="https://github.com/CarryChang/Real_Time_DataMining_Sortware/blob/master/pic/label.png"></div>
> 5. 单家民宿的UGC情感分析结果
<div align=center><img src="https://github.com/CarryChang/Real_Time_DataMining_Sortware/blob/master/pic/sentiment_analysis.png"></div>
<div align=center><img src="https://github.com/CarryChang/Real_Time_DataMining_Sortware/blob/master/pic/whole_emotion_analysis.png"></div>
> 6. UGC顾客打分占比
<div align=center><img src="https://github.com/CarryChang/Real_Time_DataMining_Sortware/blob/master/pic/total_score.png"></div>
> 7. 分析该民宿第二次以上的预定情况
<div align=center><img src="https://github.com/CarryChang/Real_Time_DataMining_Sortware/blob/master/pic/rebook.png"></div>
> 8. 通过数据清洗和结构化展示该民宿在不同月份的住宿情况
<div align=center><img src="https://github.com/CarryChang/Real_Time_DataMining_Sortware/blob/master/pic/time_line.png"></div>
#### 本软件包含了自己对NLP技术落地的一些实践,针对整句UGC中包含的多主题问题,使用基于词性标注的标点符号切分,将整句切分为多个分句子,然后使用主题字典1的方式对主题进行分类,工作包含数据的实时采集/数据清洗/结构化保存/UGC数据主题提取/情感分析/后结构化可视化等技术的综合性演示demo,对比顾客直接打分的结果来看,运用机器学习的情感分析方法更能挖掘到详细的顾客意见和对应的合理评分。
没有合适的资源?快使用搜索试试~ 我知道了~
携程/榛果民宿实时评论挖掘软件,包含数据的实时采集/数据清洗/结构化保存/ UGC 数据主题提取/情感分析等+源代码+文档说明
共28个文件
png:10个
xml:5个
py:4个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
3星 · 超过75%的资源 2 下载量 43 浏览量
2024-03-08
13:50:06
上传
评论
收藏 1.86MB ZIP 举报
温馨提示
<项目介绍> 携程/榛果民宿实时评论挖掘软件,包含数据的实时采集/数据清洗/结构化保存/ UGC 数据主题提取/情感分析/后结构化可视化等技术的综合性演示 Demo。基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和 NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。主要克服用户打分和评论不一致,实时对携程和美团在线民宿的满意度进行评测以及对额外数据进行可视化的综合性工具,多维度的对在线 UGC 进行数据挖掘并可视化 - 不懂运行,下载完可以私聊问,可远程教学 该资源内项目源码是个人的毕设,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。
资源推荐
资源详情
资源评论
收起资源包目录
携程榛果民宿实时评论挖掘软件.zip (28个子文件)
携程榛果民宿实时评论挖掘软件
resource.txt 135KB
data_source
demo_resource.txt 15KB
data_source_description.txt 345B
pic
GUI_main.png 255KB
7.jpeg 117KB
rebook.png 21KB
total_score.png 30KB
1.jpeg 68KB
meituan.png 389KB
data_collector.png 372KB
best_comment_analysis.png 280KB
label.png 34KB
time_line.png 24KB
environment_analysis.png 277KB
sentiment_analysis.png 24KB
LICENSE 11KB
txt_analysis
picturing.py 7KB
spider_xiecheng.py 6KB
spider_zhenguo.py 5KB
.idea
UGC_analysis.iml 467B
vcs.xml 278B
misc.xml 288B
modules.xml 276B
deployment.xml 968B
encodings.xml 193B
RealTime_UGC_Analysis_GUI.py 28KB
.gitignore 2KB
README.md 4KB
共 28 条
- 1
资源评论
- 有梦想的人不睡觉112024-04-09程序爬取不到信息啊,博主能帮忙看下吗 #运行出错
- see7462024-04-06资源很受用,资源主总结的很全面,内容与描述一致,解决了我当下的问题。
mldxxxxll5
- 粉丝: 3569
- 资源: 884
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功