没有合适的资源?快使用搜索试试~ 我知道了~
(南阳理工)大数据实验报告02.docx
5星 · 超过95%的资源 需积分: 17 22 下载量 104 浏览量
2020-12-30
14:56:28
上传
评论 2
收藏 6.34MB DOCX 举报
温馨提示
试读
56页
一、大数据平台的搭建(目录内容) 3 1. 架构设计 6 2 服务器集群的搭建 7 (1)安装Linux操作系统(目录内容)、 14 (2)安装大数据处理框架Hadoop(目录内容) 20 3 工具软件安装(目录内容) 21 (1)安装关系型数据库MySQL(目录内容) 26 (2)安装列族数据库HBase(目录内容) 27 (3)安装Zookeepper(目录内容) 28 (4)安装数据仓库Hive(目录内容) 29 (5)安装Sqoop(目录内容) 32 (6)安装Eclipse(目录内容) 33 二、数据导入(目录内容) 34 1. 数据库、表清单(目录内容) 34 2. 数据对象的定义(目录内容) 37 (1) 创建数据库(目录内容) 39 (2) 创建数据表(目录内容); 43 3. 数据分析(目录内容) 44 (1) 简单查询分析(目录内容) 45 (2) 查询条数统计分析(目录内容) 46
资源推荐
资源详情
资源评论
2020-2021 学年第一学期《大数据技术基础》考查报告
课题名称:网站用户分析
班 级: 18
级统计学
1
班 啊
学 号: 1234567 啊
姓 名: 李薇 __________
成 绩: 啊
2020 年 10 月
2
大数据技术基础大作业
目录
一、大数据平台的搭建............................................................................................................................1
1. 架构设计.....................................................................................................................................10
2 服务器集群的搭建......................................................................................................................17
(1)安装 Linux 操作系统、................................................................................................17
(2)安装大数据处理框架 Hadoop.....................................................................................21
3 工具软件安装..............................................................................................................................22
(1)安装关系型数据库 MySQL.........................................................................................24
(2)安装列族数据库 HBase...............................................................................................25
(3)安装 Zookeepper...........................................................................................................28
(4)安装数据仓库 Hive......................................................................................................35
(5)安装 Sqoop....................................................................................................................36
(6)安装 Eclipse..................................................................................................................38
二、数据导入..........................................................................................................................................39
1. 数据库、表清单.........................................................................................................................40
2. 数据对象的定义.........................................................................................................................41
(1) 创建数据库.................................................................................................................43
(2) 创建数据表;.............................................................................................................44
3. 数据分析.....................................................................................................................................45
(1) 简单查询分析.............................................................................................................46
(2) 查询条数统计分析.....................................................................................................47
(3) 关键字条件查询分析.................................................................................................48
(4) 根据用户行为分析.....................................................................................................49
(5) 用户实时查询分析.....................................................................................................50
三、个人总结..........................................................................................................................................51
1
大数据技术基础大作业
一、大数据平台的搭建
1. 架构设计
1.因为 VMware 较为耗费内存,所以使用 VirtualBox
2. 配置 VirtualBox
运行界面
设置虚拟电脑存储位置
【左上角】 管理–>全局设定–>常规–> 默认虚拟机位置
2
大数据技术基础大作业
设置虚拟机与主机之间鼠标切换热键
【左上角】 管理–>全局设定–>热键–>虚拟电脑*
3. 导入虚拟电脑
【左上角】 管理–>导入虚拟电脑
1) 选中 centos7.ova 文件所在
3
大数据技术基础大作业
2) 修改虚拟电脑配置,并导入
因为 创建的虚拟电脑比较多,我这里选中分配 512M 内存,根据自己情况而定
剩余55页未读,继续阅读
资源评论
- FelaniaLiu2023-07-28这份实验报告详细介绍了大数据实验的实施过程和结果,让人对该领域有了更清晰的了解。
- 会飞的黄油2023-07-28该报告还结合实际应用场景,讨论了大数据在该领域中的潜在应用前景,为读者提供了更多思考和探索的方向。
- 黄涵奕2023-07-28报告中对实验过程中遇到的问题和挑战进行了详尽描述,分享了解决方案,有助于读者更好地应对类似问题。
- 十二.122023-07-28实验报告提供了充足的实验数据和统计结果,为读者提供了客观可靠的依据和参考。
- 罗小熙2023-07-28报告内容结构清晰,逻辑性强,能够让读者顺利理解实验设计和数据分析的过程。
屈小康
- 粉丝: 69
- 资源: 2
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功