1. 程式人生 > >Flink on YARN快速入門指南

Flink on YARN快速入門指南

  Apache Flink是一個高效、分散式、基於Java和Scala(主要是由Java實現)實現的通用大資料分析引擎,它具有分散式 MapReduce一類平臺的高效性、靈活性和擴充套件性以及並行資料庫查詢優化方案,它支援批量和基於流的資料分析,且提供了基於Java和Scala的API。

  從Flink官方文件可以知道,目前Flink支援三大部署模式:Local、Cluster以及Cloud,如下圖所示:

  本文將簡單地介紹如何部署Apache Flink On YARN(也就是如何在YARN上執行Flink作業),本文是基於Apache Flink 1.0.0以及Hadoop 2.2.0。

  在YARN上啟動一個Flink主要有兩種方式:(1)、啟動一個YARN session(Start a long-running Flink cluster on YARN);(2)、直接在YARN上提交執行Flink作業(Run a Flink job on YARN)。下面將分別進行介紹。

Flink YARN Session

  這種模式下會啟動yarn session,並且會啟動Flink的兩個必要服務:JobManager和TaskManagers,然後你可以向叢集提交作業。同一個Session中可以提交多個Flink作業。需要注意的是,這種模式下Hadoop的版本至少是2.2,而且必須安裝了HDFS(因為啟動YARN session的時候會向HDFS上提交相關的jar檔案和配置檔案)。我們可以通過./bin/yarn-session.sh

指令碼啟動YARN Session,由於我們第一次使用這個指令碼,我們先看看這個指令碼支援哪些引數:

[[email protected] flink]$ ./bin/yarn-session.sh Usage: Required -n,--container <arg>   Number of YARN container to allocate (=Number of Task Managers) Optional -D <arg>                        Dynamic properties
-d,--detached                   Start detached -jm,--jobManagerMemory <arg>    Memory for JobManager Container [in MB] -nm,--name <arg>                Set a custom name for the application on YARN -q,--query                      Display available YARN resources (memory, cores) -qu,--queue <arg>               Specify YARN queue. -s,--slots <arg>                Number of slots per TaskManager -st,--streaming                 Start Flink in streaming mode -tm,--taskManagerMemory <arg>   Memory per TaskManager Container [in MB]

各個引數的含義裡面已經介紹的很詳細了。在啟動的是可以指定TaskManager的個數以及記憶體(預設是1G),也可以指定JobManager的記憶體,但是JobManager的個數只能是一個。好了,我們開啟動一個YARN session吧:

./bin/yarn-session.sh -n 4 -tm 8192 -s 8

上面命令啟動了4個TaskManager,每個TaskManager記憶體為8G且佔用了8個核(是每個TaskManager,預設是1個核)。在啟動YARN session的時候會載入conf/flink-config.yaml配置檔案,我們可以根據自己的需求去修改裡面的相關引數(關於裡面的引數含義請參見Flink官方文件介紹吧)。一切順利的話,我們可以在https://www.iteblog.com:9981/proxy/application_1453101066555_2766724/#/overview上看到類似於下面的頁面:

啟動了YARN session之後我們如何執行作業呢?很簡單,我們可以使用./bin/flink指令碼提交作業,同樣我們來看看這個指令碼支援哪些引數:

[iteblog@www.iteblog.com flink-1.0.0]$ bin/flink ./flink <ACTION> [OPTIONS] [ARGUMENTS] The following actions are available: Action "run" compiles and runs a program. Syntax: run [OPTIONS] <jar-file> <arguments> "run" action options: -c,--class <classname>               Class with the program entry point ("main" method or "getPlan()" method. Only needed if the JAR file does not specify the class

相關推薦

Flink on YARN快速入門指南

  Apache Flink是一個高效、分散式、基於Java和Scala(主要是由Java實現)實現的通用大資料分析引擎,它具有分散式 MapReduce一類平臺的高效性、靈活性和擴充套件性以及並行資料庫查詢優化方案,它支援批量和基於流的資料分析,且提供了基於Ja

MariaDB快速入門指南

mariadb 數據庫 linux 快速入門目錄 前言 一、數據庫中的數據結構 與SQL語言 1、數據結構 2 、SQL語言 二、MariaDB安裝及初始化配置 1、安裝 2、配置防火墻

針對Quant的Python快速入門指南

是我 調試方法 利用 learn sub get 講解 blog .com 作者:用Python的交易員 (原創文章,轉載請註明出處)最近有越來越多的朋友在知乎或者QQ上問我如何學習入門Python,就目前需求來看,我需要寫這麽一篇指南。針對整個vn.py框架的學習,整體上

Citrix XenServer ? Workload Balancing 7.3 快速入門指南

Workload Balancin Citrix 思傑 XenServer 第?1?章?簡介XenServer Workload Balancing 虛擬設備是一種基於 Linux 的虛擬機,可用於在環境中快速部署XenServer Workload Balancing 功能。只需幾個簡單的步

Docker快速入門指南

epel nds .com lose nta 指南 format utf aux 鏡像操作 搜索鏡像 $ docker search centos 下載鏡像 $ docker pll centos 導入鏡像 $ docker load < ./docker/ima

Flink1.6系列之—Flink on yarn流程詳解

端口 準備 -a 根據 images mas info 使用 臨時 本篇我們介紹下,Flink在YARN上運行流程: 當開始一個新的Flink yarn 會話時,客戶端首先檢查所請求的資源(containers和內存)是否可用。如果資源夠用,之後,上傳

Flink on Yarn模式啟動流程分析

cin XML images ont list action -i 多個 信息 此文已由作者嶽猛授權網易雲社區發布。歡迎訪問網易雲社區,了解更多網易技術產品運營經驗。Flink On Yarn 架構Paste_Image.png前提條件首先需要配置YARN_CONF_DIR

Flink on Yarn模式啟動流程原始碼分析

此文已由作者嶽猛授權網易雲社群釋出。 歡迎訪問網易雲社群,瞭解更多網易技術產品運營經驗。 Flink on yarn的啟動流程可以參見前面的文章 Flink on Yarn啟動流程,下面主要是從原始碼角度看下這個實現,可能有的地方理解有誤,請給予指正,多謝。 --> 1.命令列啟動yarn sessi

Flink on Yarn模式啟動流程源代碼分析

www and *** err wap `` dem 註冊 contex 此文已由作者嶽猛授權網易雲社區發布。歡迎訪問網易雲社區,了解更多網易技術產品運營經驗。Flink on yarn的啟動流程可以參見前面的文章 Flink on Yarn啟動流程,下面主要是從源碼角度看

GN 快速入門指南

GN Quick Start guide 執行 GN 你可以在命令列裡直接輸入gn執行。因為在depot_tools(路徑應該在你的環境變數PATH中已經設定過)工具目錄中有一個相同名字的指令碼。這個指令碼會找到當前目錄中的二進位制檔案並執行它。 構建一個build 使用GY

flink on yarn部分原始碼解析 (FLIP-6 new mode)

我們在https://www.cnblogs.com/dongxiao-yang/p/9403427.html文章裡分析了flink提交single job到yarn叢集上的程式碼,flink在1.5版本後對整個框架的deploy方式重構了全新的流程(參考https://cwiki.apache.org/co

flink開發實戰之 flink on yarn

flink 執行模式 Flink 和spark一樣有三種部署模式,分別是 Local、Standalone Cluster 和 Yarn Cluster。 實戰開發主要使用Yarn Cluster模式,所以本文主要介紹yarn  模式下flink任務的執行和資源分配。 Ya

Flink on yarn的問題:Invalid AMRMToken

目前採用的Flink的版本是1.4.2,執行在yarn上,總是時不時的報錯“Invalid AMRMToken from appattempt”,導致AM掛掉。   簡而言之,就是AM和RM溝通的過程中,突然AM提供的Token不被認可,導致拒絕連線,進而AM掛掉。   後來發現早

Quartz.NET快速入門指南

    最近工作中遇到了Quartz.net,為了更好的理解公司程式碼的寫法,於是就好好的研究了一下這個東西,確實是好東西,既然是好東西,我就拿出來分享一下。萬丈高樓平地起,我們也是從入門開始吧。    歡迎使用Quartz.NET快速入門指南。 在

Flink-on-yarn

解壓 stat master swd run rec 地址 abi man 介紹 官網下載 https://www.apache.org/dyn/closer.lua/flink/flink-1.6.1/flink-1.6.1-bin-hadoop28-scala_

.NET Core on K8S快速入門課程(Jessetalk)

01-介紹K8s是什麼 Docker VS VirtualMachine 敏捷地應用建立和部署 持續開發,整合和部署 開發和執行相分離 開發,測試和生產環境的持續 雲和作業系統版本的可移植性,可以執行在 Ubuntu, RHEL, CoreOS, on-prem, Google Co

Apollo 1.0快速入門指南

關於本指南 在阿波羅1.0快速入門指南提供了所有的基本指令瞭解,安裝和建設阿波羅。 檔案約定 下表列出了本文件中使用的約定: 圖示 描述 膽大 重點 Mono-space font 程式碼,鍵入的資料 斜體 檔案,部分和標題的標

零基礎想學Python爬蟲?這是斯坦福大學教授給你的快速入門指南

      本文主要內容:以最短的時間寫一個最簡單的爬蟲,可以抓取論壇的帖子標題和帖子內容。 本文受眾:沒寫過爬蟲的萌新。 入門 爬蟲是怎麼工作的? 當然在學習Python的道路上肯定會困難,沒有好的學習資料,怎麼去學習呢?

Spark快速入門指南 – Spark安裝與基礎使用

Apache Spark 是一個新興的大資料處理通用引擎,提供了分散式的記憶體抽象。Spark 正如其名,最大的特點就是快(Lightning-fast),可比 Hadoop MapReduce 的處理速度快 100 倍。此外,Spark 提供了簡單易用的 API,幾行程式碼

h5py快速入門指南

h5py是Python語言用來操作HDF5的模組。下面的文章主要介紹h5py的快速入門指南,翻譯自h5py的官方文件:http://docs.h5py.org/en/latest/quick.html 。該翻譯僅為個人學習h5py為目的,如有翻譯不當之處,請速