二、需求概述

在本节中，我们将使用 Hive 对以下指标进行统计并演示：

1. 移动端和 PC 端，用户比例

2. 用户评论周期（收到货后，一般多久进行评论）

3. 会员级别统计（判断购买此商品的用户级别）

4. 每天评论量（大体能反映出下单时间）

5. 自定义 UDF，功能为：去掉评论时间的时分秒，只保留年月日

三、实验步骤

1. 获取本次实验使用的数据：

[hfut@master ~]$ cp ~/resources/hive-data/pinglun ~/hive-data/

2. 初始化操作

启动 Hadoop；启动 MySQL 服务；启动 Hive。

3. 在 Hive 创建一张表，用于存放清洗后的数据，表名为 pinglun，字段名、字符类型、字段

解释如下：

1. productid string 产品 ID

2. commentcount int 评论数

3. goodcount int 好评数

4. generalcount int 中评数

5. poorcount int 差评数

6. goodrateshow float 好评率

7. generalrateshow float 中评率

8. poorrateshow float 差评率

9. guid string 随机生成 ID

10. content string 评论内容

11. creationtime string 写评论的时间

12. score int 打分

13. nickname string 昵称

14. userlevelname string 会员级别

15. userclientshow string 评论设备

16. ismobile string 是否移动端

17. days int 评论时间距【收货/下单】时间多长时间

hive> create table pinglun ( productid string, commentcount int, goodcount int, generalcount int,

poorcount int, goodrateshow float, generalrateshow float, poorrateshow float, guid string, content

string, creationtime string, score int, nickname string, userlevelname string, userclientshow string,

ismobile string, days int) row format delimited fields terminated by '\t';

创建成功后，查看 pinglun 表的表结构：

15-Hive统计1

大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第15期_HBase、Hive与RDBMS 共15页.pdf

Hadoop简单应用案例，包括MapReduce、单词统计、HDFS基本操作、web日志分析、Zookeeper基本使用、Hive简单操作等

第15章-Sqoop+Hive+Hbase+Kettle+R某技术论坛日志分析项目案例.docx

Hive做一个PV，UV统计的案例记录-附件资源

apache-hive-0.14.0-bin.tar

apache-hive-3.1.2-bin.tar.gz

apache-hive-2.3.5-bin.tar.gz

hive-笔记--hive常用用法

Hive练习项目统计各种TOP的实战(数据和代码)

精品课程推荐 大数据与云计算教程课件 优质大数据课程 15.Hive（共46页）.pptx

Hive安装与部署并词频统计.docx

基于统计方法的Hive数据仓库查询优化实现

07.app数据统计--hive报表迁移到mysql--充分注意编码统一.mp4

apache-hive-0.13.1-bin.tar.zip

大数据处理--Hive技术架构及应用

hive-jdbc-1.1.1.jar

mustached-hive-udfs:一些有用的 Hive UDF 和 UDAF

stats:统计并显示 Hive 版本的 GitHub 下载计数

hive-1.1.0-cdh5.14.2.tar.gz

HIVE-SQL开发规范.docx

hive-1.1.0-cdh5.14.0.tar.gz

快速学习-Hive 基本概念

hive-0.13.1-bin

Hive.sql，hive的元数据

Hive新手学习资料之Hive入门与实战.+Hive用户手册+hive函数大全中文版资源合集

Hive表分区

Hive学习资料书籍压缩文件

最新资源

大数据与云计算培训学习资料 Hadoop集群细细品味Hadoop_第15期_HBase、Hive与RDBMS 共15页.pdf

精品课程推荐大数据与云计算教程课件优质大数据课程 15.Hive（共46页）.pptx