Amazon_Vine_Analysis
交付品1:对Amazon产品评论执行ETL
交付品2:确定藤评的偏见
交付品3:一份关于分析的书面报告(README.md)
分析概述
我的任务是分析由付费Amazon Vine计划成员撰写的Amazon评论。 Amazon Vine程序是一项服务,允许制造商和发布者接收其产品的评论。 利用我对PySpark的了解,我确定了对Vine程序中编写的评论是否有偏见。 对于此分析,我确定了对Vine的付费评论对5星级评论的百分比是否有所影响。
结果
使用项目符号列表和DataFrame的图像作为支持,请解决以下问题:
那里有多少个Vine评论和非Vine评论?
5星级的葡萄藤评论有多少? 5星有多少非葡萄评语?
五星级的葡萄评鉴中有百分之几? 5星级的非葡萄评语中有多少?
概括
在摘要中,说明Vine程序中的审核是否存在任何积极偏见。 使用分析