没有合适的资源？快使用搜索试试~ 我知道了~

文库首页安全技术网络安全Flink安装配置(2)1

Flink安装配置(2)1

flink

需积分: 0 2 下载量 137 浏览量 2022-08-08 23:10:01 上传评论收藏 80KB DOCX 举报

温馨提示

试读

11页

Flink安装配置(2)1

资源推荐

资源详情

资源评论

Flink（二）CentOS7.5 搭建 Flink1.6.1 分布式集群

一. Flink 的下载

安装包下载地址：http://flink.apache.org/downloads.html ，选择对应 Hadoop 的 Flink 版本

下载

[admin@bigdata11 software]$ wget

http://mirrors.tuna.tsinghua.edu.cn/apache/flink/flink-1.6.1/flink-

1.6.1-bin-hadoop27-scala_2.11.tgz

[admin@bigdata11 software]$ ll

-rw-rw-r-- 1 admin admin 301867081 Sep 15 15:47 flink-1.6.1-bin-

hadoop27-scala_2.11.tgz

Flink 有三种部署模式，分别是 Local、Standalone Cluster 和 Yarn Cluster。

二. Local 模式

对于 Local 模式来说，JobManager 和 TaskManager 会公用一个 JVM 来完成 Workload。如

果要验证一个简单的应用，Local 模式是最方便的。实际应用中大多使用 Standalone 或者

Yarn Cluster，而 local 模式只是将安装包解压启动（./bin/start-local.sh）即可，在这里不在演

示。

三. Standalone 模式

快速入门教程地址：https://ci.apache.org/projects/flink/flink-docs-release-

1.6/quickstart/setup_quickstart.html

1. 软件要求

� Java 1.8.x 或更高版本，

� ssh（必须运行 sshd 才能使用管理远程组件的 Flink 脚本）

集群部署规划

节点名称

master

worker

zookeeper

bigdata11

master

zookeeper

bigdata12

master

worker

zookeeper

bigdata13

worker

zookeeper

2. 解压

[admin@bigdata11 software]$ tar zxvf flink-1.6.1-bin-hadoop27-

scala_2.11.tgz -C /opt/module/

[admin@bigdata11 software]$ cd /opt/module/

[admin@bigdata11 module]$ ll

drwxr-xr-x 8 admin admin 125 Sep 15 04:47 flink-1.6.1

3. 修改配置文件

[admin@bigdata11 conf]$ ls

flink-conf.yaml log4j-console.properties log4j-yarn-

session.properties logback.xml masters sql-client-

defaults.yaml

log4j-cli.properties log4j.properties logback-console.xml

logback-yarn.xml slaves zoo.cfg

修改 flink/conf/masters，slaves，flink-conf.yaml

[admin@bigdata11 conf]$ sudo vi masters

bigdata11:8081

[admin@bigdata11 conf]$ sudo vi slaves

bigdata12

bigdata13

[admin@bigdata11 conf]$ sudo vi flink-conf.yaml

taskmanager.numberOfTaskSlots：2

jobmanager.rpc.address: bigdata11

可选配置：

� 每个 JobManager（jobmanager.heap.mb）的可用内存量，

� 每个 TaskManager（taskmanager.heap.mb）的可用内存量，

� 每台机器的可用 CPU 数量（taskmanager.numberOfTaskSlots），

� 集群中的 CPU 总数（parallelism.default）和

� 临时目录（taskmanager.tmp.dirs）

4. 拷贝安装包到各节点

[admin@bigdata11 module]$ scp -r flink-1.6.1/ admin@bigdata12:`pwd`

[admin@bigdata11 module]$ scp -r flink-1.6.1/ admin@bigdata13:`pwd`

5. 配置环境变量

配置所有节点 Flink 的环境变量

[admin@bigdata11 flink-1.6.1]$ sudo vi /etc/profile

export FLINK_HOME=/opt/module/flink-1.6.1

export PATH=$PATH:$FLINK_HOME/bin

[admin@bigdata11 flink-1.6.1]$ source /etc/profile

6. 启动 flink

[admin@bigdata11 flink-1.6.1]$ ./bin/start-cluster.sh

Starting cluster.

Starting standalonesession daemon on host bigdata11.

Starting taskexecutor daemon on host bigdata12.

Starting taskexecutor daemon on host bigdata13.

jps 查看进程

7. WebUI 查看

http://bigdata11:8081

8. Flink 的 HA

首先，我们需要知道 Flink 有两种部署的模式，分别是 Standalone 以及 Yarn Cluster 模式。对

于 Standalone 来说，Flink 必须依赖于 Zookeeper 来实现 JobManager 的 HA（Zookeeper 已

经成为了大部分开源框架 HA 必不可少的模块）。在 Zookeeper 的帮助下，一个 Standalone

的 Flink 集群会同时有多个活着的 JobManager，其中只有一个处于工作状态，其他处于

Standby 状态。当工作中的 JobManager 失去连接后（如宕机或 Crash），Zookeeper 会从

Standby 中选举新的 JobManager 来接管 Flink 集群。

对于 Yarn Cluaster 模式来说，Flink 就要依靠 Yarn 本身来对 JobManager 做 HA 了。其实这

里完全是 Yarn 的机制。对于 Yarn Cluster 模式来说，JobManager 和 TaskManager 都是被

Yarn 启动在 Yarn 的 Container 中。此时的 JobManager，其实应该称之为 Flink Application

Master。也就说它的故障恢复，就完全依靠着 Yarn 中的 ResourceManager（和 MapReduce

的 AppMaster 一样）。由于完全依赖了 Yarn，因此不同版本的 Yarn 可能会有细微的差异。这

里不再做深究。

1）修改配置文件

修改 flink-conf.yaml，HA 模式下，jobmanager 不需要指定，在 master file 中配置，由

zookeeper 选出 leader 与 standby。

#jobmanager.rpc.address: bigdata11

high-availability:zookeeper

#指定高可用模式（必须）

high-availability.zookeeper.quorum:bigdata11:2181,bigdata12:2181,bigdata13:2181

#ZooKeeper 仲裁是 ZooKeeper 服务器的复制组，它提供分布式协调服务（必

须）

high-availability.storageDir:hdfs:///flink/ha/

#JobManager 元数据保存在文件系统 storageDir 中，只有指向此状态的指针存

储在 ZooKeeper 中（必须）

剩余10页未读，继续阅读

评论收藏

内容反馈

资源评论

资源反馈

评论星级较低，若资源使用遇到问题可联系上传者，3个工作日内问题未解决可申请退款~

坑货两只

粉丝: 65
资源: 290

上传资源快速赚钱

我的内容管理展开

我的资源快来上传第一个资源

我的收益

登录查看自己的收益

我的积分登录查看自己的积分

我的C币登录后查看C币余额

我的收藏

我的下载

下载帮助

前往需求广场，查看用户热搜

Flink安装配置(2)1

flink conf配置文件

Flink standalone安装

CDH6配置Flink1.12.0(编译安装).pdf

flink的高可用配置ha-conf

1、Flink基本概念与部署_flink_

flink-1.8.1_after_compile.tar.gz

项目2-Flink安装部署与快速入门1

sb-dp-flink-jobs-config:Flink作业的配置

Flink集群安装部署.txt

Flink 开发环境搭建和应用的配置部署及运行.pdf

Flink安装包、安装文档

Flink HA配置指南文档-v1.6.1

flink安装所需要的第三方jar

实验8 Flink初级编程实践

Flink1.7.2集群安装.docx

Flink-安装部署与快速入门.docx

Flink安装-简介.docx

Flink原理与实践-Flink的部署和配置.pdf

Flink安装及使用 - 简书.pdf

Flink在CDH配置部署及读取kafka的实例验证；

Flink standalone 集群安装步骤-v1.6.1

Flink SQL大数据项目实战（基于Flink1.14.3版本）

Flink V1.6.1高可用配置指南

flink下沉数据到hive的环境配置.md

sjf0115#PubLearnNotes#[未完]Flink配置Hadoop1

Flink入门系列2----Linux安装flink并启动-附件资源

基于尚硅谷的Flink源码视频的Flink环境配置和任务提交流程、组件通信、任务调度以及内存管理源码梳理

最新资源