没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
第 1 关:统计 2020 年上映的电影中,当前总票房最高的 10 部电影
#进入 hive
hive
#在 hive 中创建数据库 mydb
create database mydb;
#使用数据库 mydb
use mydb;
#创建表 moviecleaned 并使用"/t"分割字段
create table moviecleaned(movie_name string,boxoffice string, box_rate string,
sessions string, show_count_rate string, avg_number string, attendance string,
total_boxoffice string, movie_days string,current_time string,releaseDate string)
row format delimited fields terminated by ' '
stored as textfile;
#将本地清洗后的数据导入 moviecleaned 表中
load data local inpath '/data/workspace/myshixun/data/movies.txt' into table
moviecleaned;
#创建 top10_boxoffice 表,用来存放数据查询的结果
create table top10_boxoffice(movie_name string, boxoffice float) row format
delimited fields terminated by ' ' stored as textfile;
#查询,并将结果导入 top10_boxoffice 表中
insert overwrite table top10_boxoffice
select movie_name,max(round(total_boxoffice,1)) m
from moviecleaned
WHERE releaseDate like '2020%'
group by movie_name
ORDER BY m DESC
limit 10;
资源评论
- m0_588265332023-06-19有数据吗?
A_请叫我松鼠
- 粉丝: 0
- 资源: 1
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功