# git 操作指南
1. git clone ssh链接(如[email protected]:id-none/Digital-module.git)把github仓库下载下来
2. git add . 上传所有文件夹内容
3. git commit -m "标签名字" 给add文件增加标签名字
4. git push 推送文件去文档
4. git pull 把云仓库拉到本地下来
# C: A Wealth of Data
## Problem:
在它创建的在线市场中,亚马逊为客户提供了一个对购买进行评级和评论的机会。个人评级——称为“星级评级”——允许购买者用1(低评级,低满意度)到5(高评级,高满意度)的等级来表达他们对产品的满意程度。此外,客户可以提交基于文本的信息——称为“评论”——以表达对产品的进一步意见和信息。其他客户可以对这些评论进行有帮助或无帮助的评级——称为“有帮助评级”——以帮助他们自己的产品购买决策。公司利用这些数据来洞察他们所参与的市场、参与的时间,以及产品设计特征选择的潜在成功。
阳光公司计划在网上市场推出并销售三种新产品:微波炉、婴儿奶嘴和吹风机。他们聘请你的团队作为顾问,以确定关键模式,关系,措施和参数,在过去的客户提供的评级和评论与其他竞争产品,以1)通知他们的在线销售战略和2)确定潜在的重要设计特征,将提高产品的可取性。阳光公司过去曾使用数据来指导销售策略,但他们以前从未使用过这种特殊的数据组合和类型。阳光公司特别感兴趣的是这些数据中基于时间的模式,以及它们是否以有助于公司制作成功产品的方式相互作用。
为了帮助您,Sunshine的数据中心为您提供了吹风机这个项目的三个数据文件。tsv,微波炉。tsv, pacifier.tsv。这些数据代表了在数据显示的时间段内亚马逊市场上销售的微波炉、婴儿奶嘴和吹风机的客户提供的评级和评论。还提供了数据标签定义的词汇表。提供的数据文件包含您应该用于此问题的唯一数据。
## Requirements:
1. 分析提供的三种产品数据集,以识别、描述和支持数学证据、有意义的定量和/或定性模式、关系、度量,以及星级评级、评论、以及帮助评级,这将帮助阳光公司在他们的三个新的在线市场产品上取得成功。
2. 请用您的分析来解决阳光公司营销总监提出的以下具体问题和要求:
1. 一旦他们的三种产品在在线市场上销售,确定基于评级和评论的数据度量,这对阳光公司的跟踪是最有信息量的。
2. 确定并讨论每个数据集中基于时间的度量和模式,这些度量和模式可能表明产品的声誉在在线市场上是上升还是下降。
3. 确定基于文本的度量和基于评级的度量的组合,以最好地指出潜在的成功或失败的产品。
4. 特定的星级评级是否会引发更多的评论?例如,用户是否更有可能在看到一系列低星级评级后写一些评论?
5. 基于文本的评论的特定质量描述符,如“热情”、“失望”等,是否与评级水平密切相关?
3. 写一封一到两页的信给阳光公司的市场总监,总结你们团队的分析和结果。包括你的团队最自信地向市场总监推荐的结果的具体理由。
![image-20220119150449540](美赛.assets/image-20220119150449540.png)
https://d.wanfangdata.com.cn/thesis/ChJUaGVzaXNOZXdTMjAyMTEyMDESCFkzMjcxNDQyGgh4cHJkeXNzcQ%3D%3D
情感分析模型([LSTM](https://so.csdn.net/so/search?q=LSTM&spm=1001.2101.3001.7020)+RNN)
1. 数据集数据来源http://qwone.com/~jason/20Newsgroups/
1. 训练集labeledTrainData.tsv(24500条带标签的训练数据)
id sentiment review 表示文本唯一确认id,情感色彩类别标签,待分析的文本数据
如下
![image-20220120141416221](美赛.assets/image-20220120141416221.png)
2. 测试集(testData.tsv:22000条无标签测试数据)
id 表示文本唯一确认id, review,评论的主体文本数据
![image-20220120141832992](美赛.assets/image-20220120141832992.png)
2. 基础模型
词向量模型:
由于计算机只认识二进制数字,所以我们映入了词向量模型来解决这个问题。
![image-20220120142503324](美赛.assets/image-20220120142503324.png)
我们可以将一句话中的每一个词都转换成一个向量。
![image-20220120142525793](美赛.assets/image-20220120142525793.png)
词向量是具有空间意义的并不是简单的映射!
例如,我们希望单词 “love” 和 “adore” 这两个词在向量空间中是有一定的相关性的,因为他们有类似的定义,他们都在类似的上下文中使用。单词的向量表示也被称之为词嵌入。
![image-20220120142733318](美赛.assets/image-20220120142733318.png)
为了去得到这些词嵌入,我们使用一个非常牛逼的模型 “Word2Vec”。简单的说,这个模型根据上下文的语境来推断出每个词的词向量。
Word2Vec 模型根据数据集中的每个句子进行训练,并且以一个固定窗口在句子上进行滑动,根据句子的上下文来预测固定窗口中间那个词的向量。然后根据一个损失函数和优化方法,来对这个模型进行训练。(在文中在我们使用了了谷歌已经训练好的词向量wordList.npy
现在,我们已经得到了神经网络的输入数据 —— 词向量,接下来让我们看看需要构建的神经网络。NLP 数据的一个独特之处是它是时间序列数据。每个单词的出现都依赖于它的前一个单词和后一个单词。由于这种依赖的存在,我们使用循环神经网络来处理这种时间序列数据。
RNN网络结构
![image-20220120143405002](美赛.assets/image-20220120143405002.png)
对于基本RNN来说,它能够处理一定的短期依赖,但无法处理长期依赖问题。 当句子比较长,RNN就无法处理这种问题。因为当序列较长时,序列后部的梯度 很难反向传播到前面的序列,这就产生了梯度消失问题。当然,RNN也存在梯度 爆炸问题。
隐藏状态是当前单词向量和前一步的隐藏状态向量的函数。并且这两项之和需要通过激活函数来进行激活。
![image-20220120143538111](美赛.assets/image-20220120143538111.png)
对于基本RNN来说,它能够处理一定的短期依赖,但无法处理长期依赖问题。 当句子比较长,RNN就无法处理这种问题。因为当序列较长时,序列后部的梯度 很难反向传播到前面的序列,这就产生了梯度消失问题。当然,RNN也存在梯度爆炸问题。
RNN本时刻的隐藏层信息只来源于当前输入和上一时刻的隐藏层信息,没有 记忆功能。为了解决RNN的长期依赖也即梯度消失问题,LSTM应运而生。LSTM 的网络结构图如下:
![image-20220120145529988](美赛.assets/image-20220120145529988.png)
该单元根据输入数据 x(t) ,隐藏层输出 h(t) 。在这些单元中,h(t) 的表达形式比经典的 RNN 网络会复杂很多。这些复杂组件分为四个部分:输入门,输出门,遗忘门和一个记忆控制器。每个门都将 x(t) 和 h(t-1) 作为输入(没有在图中显示出来),并且利用这些输入来计算一些中间状态。每个中间状态都会被送入不同的管道,并且这些信息最终会汇集到 h(t) 。
词频率:
![image-20220120145946192](美赛.assets/image-20220120145946192.png)
参数调整:
选择合适的超参数来训练你的神经网络是至关重要的。你会发现你的训练损失值与你选择的优化器(Adam,Adadelta,SGD,等等),学习率和网络架构都有很大的关系。特别是在RNN和LSTM中,单元数量和词向量的大小都是重要因素。
- 学习率:RNN最难的一点就是它的训练非常困难,因为时间步�
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
数学建模学习资料 数学建模大赛赛题、解决方案资料,供备赛者学习参考!数学建模大赛赛题、解决方案资料,供备赛者学习参考!数学建模大赛赛题、解决方案资料,供备赛者学习参考!数学建模大赛赛题、解决方案资料,供备赛者学习参考!数学建模大赛赛题、解决方案资料,供备赛者学习参考!数学建模大赛赛题、解决方案资料,供备赛者学习参考!数学建模大赛赛题、解决方案资料,供备赛者学习参考!数学建模大赛赛题、解决方案资料,供备赛者学习参考!数学建模大赛赛题、解决方案资料,供备赛者学习参考!数学建模大赛赛题、解决方案资料,供备赛者学习参考!数学建模大赛赛题、解决方案资料,供备赛者学习参考!数学建模大赛赛题、解决方案资料,供备赛者学习参考!数学建模大赛赛题、解决方案资料,供备赛者学习参考!数学建模大赛赛题、解决方案资料,供备赛者学习参考!数学建模大赛赛题、解决方案资料,供备赛者学习参考!数学建模大赛赛题、解决方案资料,供备赛者学习参考!数学建模大赛赛题、解决方案资料,供备赛者学习参考!数学建模大赛赛题、解决方案资料,供备赛者学习参考!数学建模大赛赛题、解决方案资料,供备赛者学习参考!数学建模大赛赛题、解决方案资料,供备赛者学习参考!数学建模大赛赛题、解决方案资料,供备赛者学习参考!数学建模大赛赛题、解决方案资料,供备赛者学习参考!
资源推荐
资源详情
资源评论
收起资源包目录
22年数学建模比赛 上海大学——三代一对.zip (98个子文件)
projectcode30312
美赛.assets
image-20220120142510399.png 27KB
image-20220120145946192.png 32KB
image-20220120143538111.png 33KB
image-20220120143405002.png 83KB
image-20220120142733318.png 24KB
image-20220120141416221.png 81KB
image-20220120145529988.png 80KB
image-20220120150054136.png 54KB
image-20220120142525793.png 26KB
image-20220119150449540.png 147KB
image-20220120142503324.png 27KB
image-20220120145634314.png 48KB
image-20220120141832992.png 73KB
.DS_Store 10KB
microwave.xlsx 673KB
question_d
pacifier1.xlsx 4.89MB
.DS_Store 6KB
hair_dryer1.xlsx 3.01MB
hair1_sheet4.txt 178B
microwave1.xlsx 605KB
star
hair_dryer_1star.txt 28KB
pacifie_5startr.txt 2.75MB
microwave_5star.txt 225KB
pacifier_1star.txt 357KB
micorowave_1star.txt 239KB
hair_dryer_5star.txt 149KB
photos
.DS_Store 6KB
奶嘴5
CnCorpus_Freq_20220121124005.txt 10KB
新建 文本文档.md 0B
吹分机5
新建 文本文档.md 250B
新建 文本文档.assets
image-20220121120234509.png 65KB
image-20220121120248458.png 19KB
image-20220121120259819.png 13KB
微波炉5
新建 文本文档.md 250B
新建 文本文档.assets
image-20220121121050033.png 65KB
image-20220121121101913.png 23KB
image-20220121121124505.png 11KB
吹风机1
新建 文本文档.md 250B
新建 文本文档.assets
image-20220121115927941.png 18KB
image-20220121115909444.png 75KB
image-20220121115956618.png 11KB
微波炉1
新建 文本文档.md 250B
新建 文本文档.assets
image-20220121120722273.png 11KB
image-20220121120701143.png 58KB
image-20220121120711429.png 25KB
奶嘴1
新建 文本文档.md 250B
新建 文本文档.assets
image-20220121121502758.png 23KB
image-20220121121513911.png 11KB
image-20220121121448597.png 70KB
美赛.pdf 734KB
reputation
.DS_Store 6KB
mairowave_3.xlsx 12KB
pacifier_3.xlsx 9KB
hair_dryer_3.xlsx 16KB
pacifier.xlsx 5.25MB
hair_dryer.xlsx 3.24MB
README.assets
geq+0.svg+xml 2KB
equation.svg+xml 2KB
epsilon_{t}.svg+xml 6KB
image-20220122104302306.png 134KB
epsilon_{t}-16428191694267.svg+xml 1KB
equation-16428191694265.svg+xml 2KB
image-20220122110036557.png 6KB
equation-16428191694241.svg+xml 2KB
image-20220122104221856.png 120KB
equation-16428191694254.svg+xml 2KB
ln+R_{t}.svg+xml 7KB
equationtex=y_{t}+%3D+S_{t}+%2B+T_{t}+%2B+R_{t}.svg+xml 5KB
times+R_{t}.svg+xml 5KB
equation-16428191694242.svg+xml 2KB
image-20220122110117786.png 17KB
image-20220122104525876.png 42KB
equation-16428191694266.svg+xml 2KB
image-20220122104144357.png 83KB
equation-16428191694253.svg+xml 2KB
image-20220122104341547.png 72KB
image-20220122104314337.png 37KB
Problem_C_Data
.DS_Store 6KB
级别_评价.xlsx 4.45MB
Problem_C_Data
Data.ipynb 27KB
microwave.tsv 1009KB
hair_dryer.tsv 4.9MB
pacifier.tsv 7.49MB
txt
micorowave_1.txt 228KB
hair_dryer_1star.txt 27KB
pacifie_5.txt 2.47MB
hair_1.txt 29KB
pacifie_5start.txt 2.75MB
micorowave_5.txt 214KB
data.ipynb 2KB
pacifie_1.txt 317KB
hair_5.txt 156KB
micorowave_1star.txt 239KB
micorowave_5star.txt 224KB
stopwords.txt 6KB
hair_dryer_5star.txt 142KB
pacifie_1start.txt 356KB
README.md 10KB
共 98 条
- 1
资源评论
龙年行大运
- 粉丝: 1001
- 资源: 3854
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- MVSF2N02ELT1G-VB一款SOT23封装N-Channel场效应MOS管
- 基于区块链的图片版权保护系统的设计与实现+详细文档+全部资料(高分毕业设计).zip
- MVGSF1N03LT1G-VB一款SOT23封装N-Channel场效应MOS管
- 西门子博途TIA编程手册
- 微信小程序投票系统(Uni-app+SpringBoot+Vue3)(至尊版) java毕业设计 源码+sql脚本+论文 完整版
- 【微信小程序】基于小程序的交友系统的设计与实现【源码+lw+部署文档+讲解】
- 【微信小程序】基于小程序+Socket+Node的IM系统设计与实现【源码+lw+部署文档+讲解】
- 【学生课程实验】基于Vue + Node的外卖系统设计与实现【源码+lw+部署文档+讲解】
- 大学生数学建模竞赛论文(长江水质的评价和趋势分析模型)II.zip
- WIN10安装S7-200 SP9不能通讯解决方案
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功