2020 MCM 周末 2
问题 C:大量数据
在它创建的在线市场中,亚马逊为客户提供了一个对购买进行评级和评估的机会。个人评级
-称为“星级评级”-允许购买者使用 1(低评级,低满意度)到 5(高评级,高满意度)的
等级来表达他们对产品的满意度。此外,客户还可以提交基于文本的消息(称为“评论”),
以表达对产品的进一步意见和信息。其他客户可以在这些评论上提交有帮助或没有帮助的评
级(称为“帮助性评级”),以帮助他们自己的产品购买决策。公司使用这些数据来深入了解
他们参与的市场、参与的时机以及产品设计功能选择的潜在成功。
阳光公司计划在网上市场推出并销售三种新产品:微波炉、婴儿奶嘴和吹风机。他们已聘请
您的团队作为顾问,以确定与其他竞争产品相关的过去客户提供的评级和评论中的关键模式、
关系、度量和参数,以 1)告知他们的在线销售战略,2)确定可能会增强产品可取性的重
要设计功能。Sunshine 公司过去曾使用数据来指导销售策略,但他们以前从未使用过这种特
殊的组合和类型的数据。阳光公司特别感兴趣的是这些数据中基于时间的模式,以及它们是
否以有助于公司打造成功产品的方式进行交互。
为了帮助您,Sunshine 的数据中心为您提供了三个用于此项目的数据文件:hair_dryer.tsv、
microwave.tsv 和 pacifier.tsv。这些数据代表了亚马逊市场上销售的微波炉、婴儿奶嘴和吹风
机在数据所示时间段内的客户提供的评级和评价。还提供了数据标签定义的词汇表。提供的
数据文件只包含您应该用于此问题的数据。
要求
一。分析所提供的三个产品数据集,以识别、描述和支持数学证据、有意义的定量和/或定
性模式、关系、衡量标准和星级评定、评审之间的参数,以及帮助性评级,这将有助于阳光
公司在他们的三个新的在线市场产品提供成功。
2。利用您的分析来解决阳光公司市场总监提出的以下具体问题和要求:
a、 一旦阳光公司的三款产品在网络市场上销售,根据对其信息量最大的评级和评论确定数
据衡量标准。
b、 识别并讨论每个数据集中基于时间的度量和模式,这些度量和模式可能表明产品在在线
市场上的声誉在增加或减少。
c、 确定基于文本的度量值和基于评级的度量值的组合,这些度量值最好地指示潜在的成功
或失败产品。
d、 特定的明星收视率会引发更多的评论吗?例如,客户在看到一系列低星级评级后,是否
更有可能撰写某种类型的评论?
e、 基于文本的评论的特定质量描述,如“热情”、“失望”和其他,是否与评级水平密切相
评论0