![](https://csdnimg.cn/release/download_crawler_static/70145870/bg1.jpg)
第三届泰迪杯全国大学生数据挖掘竞赛试题
说明: 1、参赛选手可从下述试题中 任选一题 作答,并在论文报告中标明
2、论文等级 会综合考虑论文质量和难度系数
试题试题一一 基于电商平台家电设备的消费者需求及产品数据挖掘基于电商平台家电设备的消费者需求及产品数据挖掘分析 分析分析((难度系数难度系数::1.0)
试题来源:
背景背景::
随着互联网与移动互联网的快速发展,截止 2014 年 6 月,我国的网民规模达 6.32 亿,
互联网普及率为 46.9%,2015 年中国网民的渗透率将接近 50%。2014 年天猫双十一的交易
额达 571 亿,网上购物将成为人民生活的一部分。 网民在电商平台上浏览和购物, 产生了海
量的数据, 如何利用好这些碎片化、 非结构化的数据, 将直接影响到企业产品在电商平台上
的发展, 也是大数据在实际企业经营中的应用。 对于用户在电商平台上留下的评论数据, 运
用文本分析方法,了解用户的需求、抱怨,购买原因以及产品的优点、缺点,对于改善家电
设备产品及用户体验有着重要的意义。
据观研天下行业分析:近年来我国家电设备销量增长迅速,以电热水器为例, 2011 年
电热水器市场销量比 2010 年增长 2.29%,销售额增长 5.23%;2013 年热水器零售量达到 2842
万台,零售额达到 459 亿元, 2014 年热水器整体规模向上,但增速较 2013 年有所回落,零
售量达到 2985 万台,零售额达到 504 亿元。
需求需求::
1、 分析用户对于热水器 / 净水器产品的个性化需求;
2、 分析现有电商热水器 / 净水器的产品劣势(用户抱怨点)及产品优势(用户赞点) ;
3、 分析各品牌的产品间的差异,进行差异化卖点提炼;
4、 分析用户购买的原因;
5、 对用户的购买行为进行分析挖掘(搜索关键字、购买时关注点、购买步骤、使用、
评价)(此部分可选择来做) 。
提示提示::
1、 在电商平台进行评论数据抓取(可用火车头采集器进行评论爬虫) ;
2、 对评论数据进行预处理(处理掉水军及随意发表的评论数据) ;
3、 可分品类进行细化分析(热水器:电热热水器、燃气热水器;净水器:净水机、
纯水机);
4、 对评论数据进行文本分析(好评、差评、中文分词、词频统计、情 感 分析、 语义
网络);
5、 可利用 百度指数、 淘宝指 数等互联网 工具 对热水器和净水器的 消费 人 群及搜索关
注点进行 复制 分析;
6、 建议 在国 内外相 关文 献 的基础 上尽量选择 新技术 手段进行挖掘,比如 基于深度学
习理论模 型完 成情 感分析,参 见文献:《基 于深度学习 的微博 情 感分析 》、《基 于 深
度学习 的文本情 感分类研 究》 等。
评论0
最新资源