安徽省大数据比赛环境搭建资料（全网最全版）_大数据应用开发竞赛四合天地服务器搭建知乎资源-CSDN文库

需积分: 5 11 浏览量 2024-09-07 15:35:40 上传评论收藏 528KB PDF 举报

资源推荐

资源详情

资源评论


 
一、配置 hosts 实现主机名和 ip 地址映射 ................................................. 3 
使用 ifconfig 命令查看三台机器的 ip 地址 ........................................... 3 
配置/etc 下的 hosts 文件 ......................................................... 3 
二、配置 SSH 免密登录 ................................................................. 3 
在每台机器上依次执行 ............................................................ 3 
在主机上登录其他两台机器 ......................................................... 3 
三、JDK 安装 ......................................................................... 4 
在/opt 目录下创建 software 和 module 目录 .......................................... 4 
拷贝/data 目录下的压缩包 ......................................................... 4 
解压 jdk 安装包 ................................................................. 4 
获取 jdk 安装目录 ................................................................ 4 
配置环境变量 ................................................................... 4 
重新加载下环境变量 .............................................................. 4 
分发下 jdk 安装目录和 hosts 文件以及环境变量到其他机器 ............................... 4 
四、Hadoop 安装 ...................................................................... 5 
解压压缩包 ..................................................................... 5 
获取 hadoop 安装目录 ............................................................. 5 
配置 Hadoop 的环境变量 ........................................................... 5 
重新加载下环境变量 .............................................................. 5 
修改配置文件 ................................................................... 5 
分发 hadoop 安装目录和环境变量 .................................................... 7 
Hadoop 集群初始化 ............................................................... 7 
启动 HDFS 和 yarn ................................................................ 8 
五、MySQL 安装 ....................................................................... 9 
检查当前系统是否安装过 MySQL ..................................................... 9 
解压 tar 包 ..................................................................... 9 
安装 ........................................................................... 9 
查看/etc/my.cnf 文件中 datadir 指向的目录，删除该目录下的所有文件 ................... 10 
初始化数据库 .................................................................. 10 
启动 MySQL 服务(开机自启的) ..................................................... 10 
查看临时生成的 MySQL 密码 ....................................................... 10 
登录 MySQL (输入上面生成的临时密码) ............................................. 10 
修改数据库 root 用户的密码 ...................................................... 11 
设置外部访问 MySQL 数据库 ...................................................... 11 
MySQL 的用法 ................................................................. 11 
六、Hive 安装 ....................................................................... 13 
解压 hive ..................................................................... 13 
修改名称为 hive ................................................................ 13 
修改/opt/module/hive/conf 下的 hive-env.sh.template 名称为 hive-env.sh ........... 13 
配置 hive-env.sh 文件 .......................................................... 13 
配置 hive 的全局环境（/etc/profile 和/etc/profile.d/my_env.sh） .................. 13 
Hive 元数据配置到 MySQL ......................................................... 13 
Hive 的用法 ................................................................... 15 
七、Sqoop 安装 ...................................................................... 16 
解压 Sqoop 安装包 .............................................................. 16 


 
修改名称 ...................................................................... 16 
配置环境变量 .................................................................. 16 
重新加载下环境变量 ............................................................. 16 
修改 Sqoop 配置文件（先获取 hadoop 的安装目录） .................................... 16 
拷贝 JDBC 驱动 ................................................................. 16 
查看 Sqoop 版本 ................................................................ 16 
测试 Sqoop 是否能够连接数据库 .................................................... 16 
编写 Sqoop 数据采集脚本配置脚本将 MySQL 中的 student 数据采集到 HDFS 中 ............... 17 
(1)编写数据采集脚本 job.opt ................................................... 17 
(2)执行脚本 .................................................................. 17 
编写 Sqoop 数据采集任务配置脚本，将 MySQL 的 student 数据中 age 年龄字段大于等于 25 的学生
数据采集至 HIVE 中 ................................................................ 18 
(1)[报错] sqoop 报 Make sure HIVE_CONF_DIR 问题 ................................ 18 
(2)[报错] sqoop 导入数据到 hive[Error]: Database does not exist ................ 19 
(3)执行脚本先 Hive 中导入数据 .................................................. 19 
(4)检查环境是否生效 .......................................................... 20 
八、Zookeeper 安装 .................................................................. 20 
解压 Zookeeper 安装包 .......................................................... 20 
改名 .......................................................................... 20 
配置环境变量 .................................................................. 21 
在/opt/module/zookeeper-3.5.7/这个目录下创建 zkData 文件夹 ....................... 21 
在/opt/module/zookeeper-3.5.7/zkData 目录下创建一个 myid 的文件 ................... 21 
在 conf 下复制 zoo_sample.cfg 为 zoo.cfg 并修改，在配置中增加三台节点 ................ 21 
拷贝配置好的 Zookeeper 到其他机器上 .............................................. 21 
分发环境变量 .................................................................. 22 
分别启动 Zookeeper ............................................................. 22 
查看状态 ..................................................................... 22 
客户端命令行操作 .............................................................. 22 
(1)启动客户端(先要开启 zookeeper 服务) ......................................... 22 
(2)显示所有操作命令 .......................................................... 22 
九、Flume .......................................................................... 23 
解压 flume 安装包 .............................................................. 23 
重命名为 flume ................................................................. 23 
配置环境变量(profile) .......................................................... 23 
配置 flume 的配置文件 ........................................................... 23 
flume 版本验证(flume-ng version) ............................................... 23 
十、Spark .......................................................................... 24 
解压 spark 安装包 .............................................................. 24 
重命名为 spark ................................................................. 24 
配置 spark 的环境变量 ........................................................... 24 
配置 spark 的配置文件 ........................................................... 24 
编辑 slaves,添加子节点的主机名 .................................................. 24 
分发 spark 到其他机器 ........................................................... 25 
启动 spark 集群 ................................................................ 25 
分别在主节点和从节点执行 jps .................................................... 25 
在主节点执行 spark-shell 命令 ....................................................................................................................................25