（四）： Flink1.6.1 standalone叢集模式安裝部署，幾個常用引數配置

阿新 • • 發佈：2019-02-08

NameNode檢查點異常

安裝flink之前，觀察到一個NameNode檢查點異常：
在這裡插入圖片描述

沒去找官方解釋，按照此文的第4點解決了問題：

namenode的Cluster ID 與 secondnamenode的Cluster ID 不一致，對比/dfs/nn/current/VERSION 和/dfs/snn/current/VERSION中的Cluster ID 來確認，如果不一致改成一致後重啟應該可以解決

備份/dfs/snn/current/VERSION
修改/dfs/snn/current/VERSION中的Cluster ID與/dfs/nn/current/VERSION中的一致
重啟namenode
刪除備份
但是隨後發現，該方式治標不治本。

還有一個節點今天發現了Input/output error錯誤，linux-like相關erros解決中的第二個問題，暫時沒有解決，也沒有去機房重啟（估計重啟後問題更多）。

希望有經驗的前輩可以指點一二。
在這裡插入圖片描述

Flink1.6.1安裝

要求： Java 8.x
【補充：執行Flink程式，使用Flink的話，Hadoop並不是必須的，hadoop版本需要低於等於2.8】
【我這是jdk1.8.0_131+hadoop2.6.0+cdh5.13.2+2687，所以我下載的是】

linux上安裝:

從下載頁面下載二進位制檔案。

如果您計劃將Apache Flink與Apache Hadoop一起使用（在YARN上執行Flink，連線到HDFS，連線到HBase，或使用一些基於Hadoop的檔案系統聯結器），確保選擇與您的Hadoop版本匹配的Flink包

。

wget -c http://mirrors.shu.edu.cn/apache/flink/flink-1.6.1/flink-1.6.1-bin-hadoop26-scala_2.11.tgz

解壓
tar -zxf flink-1.6.1-bin-hadoop26-scala_2.11.tgz

可以看出，進入18年，Flink社群特別活躍：
在這裡插入圖片描述

“quickstart” 頁面的後續操作不建議執行了，是本地模式，接下來看看叢集模式安裝。

standalone cluster

doc地址，因為最近有一兩個NodeManager不穩定，所以就先試試standalone cluster。YARN cluster會麻煩一些。

在這裡插入圖片描述

前提

jdk 1.8+
每臺機器已經設定JAVA_HOME
ssh免密登入

配置Flink

配置檔案位於conf/下：
在這裡插入圖片描述

配置master節點

選擇一個節點作為master節點(JobManager)，在conf/flink-conf.yaml中設定jobmanager.rpc.address 配置項為該節點的IP或者主機名。
確保所有節點有有一樣的jobmanager.rpc.address 配置。

注意！

此設定適用於standalone模式
該值可能會被JobManager節點的可執行檔案bin/jobmanager.sh指定的- -host <hostname>引數覆蓋
在高可用性模式下，如果你使用bin/start-cluster.sh指令碼（來啟動），並且在conf/masters檔案設定了（多個節點），（那麼，使用哪個節點作為Jobmanager）是自動處理的。

JVM記憶體

jobmanager.heap.size
taskmanager.heap.size
（如果是YARN，這兩個值自動配置為TaskManager的YARN容器的大小，減去一定的容差值）
以MB為單位

slaves

與HDFS配置類似，編輯檔案conf/slaves並輸入每個工作節點的IP/主機名。每個工作節點稍後將執行TaskManager。
master負擔重的話，依然可以選擇master不作為TaskManager節點（去掉localhost）。

下面是以三個節點為例的配置示意圖：
在這裡插入圖片描述

taskmanager.numberOfTaskSlots

如果此值大於1，TaskManager可以使用多個CPU核心，單個TaskManager會將獲取函式或運算子並行執行。但同時，可用記憶體是公用的。此值通常與TaskManager的計算機具有的物理CPU核心數成比例（例如，等於核心數，或核心數的一半）。
這裡，我設定為4

jobstore.cache

作業的快取大小，預設52428800（以位元組為單位），也就是50M
我這裡，機器記憶體48G，我設定為300M：314527800
預設配置檔案裡面沒有，需要自己新增

臨時I/O目錄

記憶體不夠用時，寫入到taskmanager.tmp.dirs指定的目錄中
如果未顯式指定引數，Flink會將臨時資料寫入作業系統的臨時目錄，例如Linux系統中的/ tmp

暫時先處理這些配置，以後用到了，再補充。
更多的配置資訊見配置頁面

啟動叢集

注意！
啟動指令碼前，還需要配置HADOOP_CONF_DIR

否則：
在這裡插入圖片描述

vim /etc/profile
export HADOOP_CONF_DIR=/etc/hadoop/conf
source /etc/profile

bin/start-cluster.sh

在master節點上執行該指令碼啟動JobManager，它會並通過SSH連線到從slaves檔案中列出的所有工作節點，以在相應節點上啟動TaskManager。
JobManager程序通過配置好的RPC埠（預設6123）來接收Job的提交的作業。
停止Flink：bin/stop-cluster.sh
web dashboard(jobmanager:8081)
目前dashboard看得出來功能不多，但是簡潔明瞭；
但是，這幾個數字怎麼算的？

將JobManager / TaskManager例項新增到群集

我的理解是，這些指令碼的應用場景是：

JobManager 或者TaskManager（HA）因為某些原因退出了叢集,我們需要單獨啟動
單獨stop某一節點上的程序

新增JobManager
bin/jobmanager.sh ((start|start-foreground) cluster)|stop|stop-all
新增TaskManager
bin/taskmanager.sh start|start-foreground|stop|stop-all

bin下面的指令碼：
在這裡插入圖片描述

Maven依賴

<dependency>
  <groupId>org.apache.flink</groupId>
  <artifactId>flink-java</artifactId>
  <version>1.6.1</version>
</dependency>
<dependency>
  <groupId>org.apache.flink</groupId>
  <artifactId>flink-streaming-java_2.11</artifactId>
  <version>1.6.1</version>
</dependency>
<dependency>
  <groupId>org.apache.flink</groupId>
  <artifactId>flink-clients_2.11</artifactId>
  <version>1.6.1</version>
</dependency>

下篇文章寫兩個demo提交到叢集進行測試。

參考

（四）： Flink1.6.1 standalone叢集模式安裝部署，幾個常用引數配置

NameNode檢查點異常安裝flink之前，觀察到一個NameNode檢查點異常：沒去找官方解釋，按照此文的第4點解決了問題： namenode的Cluster ID 與 secondnamenode的Cluster ID 不一致，對比/dfs/nn

構建NetCore應用框架之實戰篇（四）：BitAdminCore框架1.0登錄功能細化及技術選型

1.0 dmi 也會繼承 blank bit 技術選型 cor 我會本篇承接上篇內容，如果你不小心點擊進來，建議從第一篇開始完整閱讀，文章內容繼承性連貫性。構建NetCore應用框架之實戰篇系列一、BitAdminCore框架1.0版本 1、1.0版本是指

python爬蟲（四）：scrapy 【1. 快速上手】

中文文件：http://www.scrapyd.cn/doc/ Scrapy是採用Python開發的一個快速、高層次的螢幕抓取和web抓取框架。什麼是爬蟲框架？爬蟲框架是實現爬蟲功能的一個軟體結構和功能元件集合。爬蟲框架是一個半成品，能夠幫助使用者實現專業網路

人臉識別系列（四）：Webface系列1（CASIA-WebFace）

這篇文章的亮點在於提出一種半自動的方法來收集網路上的人臉影象，最終組成了國內人臉識別屆頗具盛名的人臉訓練集 CASIA-WebFace，同時還提出了一種11層的CNN最終達到了lfw上的state-of-art。資料集的構建構建資料集時，從網路上

搜索引擎ElasticSearch系列（四）： ElasticSearch2.4.4 sql插件安裝

china code als 插件技術分享 -s fun nlp 4.0 一：ElasticSearch sql插件簡介　　With this plugin you can query elasticsearch using familiar SQL syntax.

不耗電傳輸資料（四）：基於連線型別改變下載模式

基於連線型別改變下載模式不同連結型別對電量的消耗並不相同。不單WiFi比無線網路耗電量小的多，不同技術下的無線網路耗電量也不同。用WiFi 多數情況下，WiFi網路能夠提供更大頻寬並大量減少耗電。所以如果WiFi可用，儘量使用WiFi傳輸資料。你可以用BroadcastRece

Mybatis系列全解（八）：Mybatis的9大動態SQL標籤你知道幾個？提前致女神！

> 封面：洛小汐 > > 作者：潘潘 ![](https://pic2.zhimg.com/v2-7eec74a18a3d77f5008c04f97b283910_r.jpg) ![](https://gitee.com/senlypan/notes/raw/master/i

javaweb學習筆記（四）：會話管理（1）

目錄會話管理 1.概念 2.cookie技術 2.1 Cookie一般處理流程 2.2 Cookie類會話管理 1.概念一次會話：開啟瀏覽器 -> 訪問一些伺服器內容 -> 關閉瀏覽器。（瀏覽器A給伺服器傳送請求，訪問web程式，該次會話就

Elam的caffe筆記之配置篇（三）：Centos 6.5下裝CUDA8.0 和cudnnv5.1

Elam的caffe筆記之配置篇（三）：Centos 6.5下裝CUDA8.0 和cudnnv5.1 配置要求：系統：centos6.5 目標：基於CUDA8.0+Opencv3.1+Cudnnv5.1+python3.6介面的caffe框架寫在前面，本文是在C

從0到1使用Kubernetes系列（四）：搭建第一個應用程式

上一篇文章《從0到1使用Kubernetes系列（三）：使用Ansible安裝Kubernetes叢集》中，我們搭建了一套Kubernetes叢集，接下來將在本文中介紹如何使用Kubernetes部署一個Nginx並通過Pod IP、Service IP、Ingress這三種方式訪問Nginx。傳統Kube

我對hyperledger fabric1.1.0的執著（四）：部署單機多節點網路

1、生成證書檔案（1.1）環境清理接上一篇，已跑通e2e_cli案例，此處需要執行以下命令進行環境清理： cd /opt/gopath/src/github.com/hyperledger/fabric/examples/e2e_cli bash network_

yershop商城系統Thinkphp開發（四）——微信篇1：微信公眾號靜默授權註冊及獲取使用者資訊

微信登陸包括兩部分：1.常用的靜默授權；2.獲取使用者身份資訊開發環境： Thinkphp3.2.3beta+onethink、yershop 新浪SAE伺服器，點此註冊認證微信服務號靜默授權基礎配置 1.認證微信服務號 2.介面許可

Ext JS 6開發例項（四）：調整主檢視

上文把主介面設定好，但是主檢視因為介面的微調出現了顯示問題，本文將把它調整好了。開啟app/view/main/Main.js，可以看到主檢視是派生於標籤面板（Ext.tab.Panel）的。在檢視的標籤欄內，除了顯示標籤外，還顯示了標題欄。由於已經重新設計

物聯網平臺構架系列（四）：Amazon, Microsoft, IBM IoT 平臺導論之平臺

物聯網; iot; aws; 亞馬遜; greengrass;microsoft; azure;ibm; watson; bluemix最近研究了一些物聯網平臺技術資料，以做選型參考。腦子裏積累大量信息，便想寫出來做一些普及。作為科普文章，力爭通俗易懂，不確保概念嚴謹性。我會給考據癖者提供相關英文鏈接，以便深

centos7搭建ELK Cluster集群日誌分析平臺（四）：簡單測試

-1 簡單測試 logs ima .tar.gz 分析 -c cluster images 續之前安裝好的ELK集群　　各主機：es-1 ~ es-3 :192.168.1.21/22/23 　　　　　　logstash:　　192.168.1.24 　　　　　　ki

linux下oracle11G DG搭建（四）：興許驗證操作

歸檔驗證補充 over nts content -s 環境 fontsize linux下oracle11G DG搭建（四）：興許驗證操作環境名稱主庫備庫主機名 bjsrv shsrv 軟件版本號 RedH

elastic-job詳解（四）：失效轉移

shard out utm monit 設置 borde 點滴 title 等於 elastic-job中最關鍵的特性之一就是失效轉移。配置了失效轉移之後，如果在任務執行過程中有一個執行實例掛了，那麽之前被分配到這個實例的任務（或者分片）會在下次任務執行之前被重新分配到其他

Java-Maven（四）：Eclipse集成Maven環境配置

查找 epo 情況 jpg ont 使用 eclipse版需要 style 一般maven都需要集成到IDE上使用的，而不是單獨的使用，常見的maven可集成IDE：eclipse、IntelliJ IDEA。但這裏就只學習eclipse集成maven的基礎上，進行mav

並發編程（四）：ThreadLocal從源碼分析總結到內存泄漏

ngs 一個交互而且當前 logs 點雲然而垃圾一、目錄 1、ThreadLocal是什麽？有什麽用？ 2、ThreadLocal源碼簡要總結？ 3、ThreadLocal為什麽會導致內存泄漏？二、ThreadLocal是

Qt移動應用開發（四）：應用粒子特效

ons -i 遊戲 direct mit class png pop 狀態 Qt移動應用開發（四）：應用粒子特效上一篇文章介紹了Qt Quick是如何對幀動畫進行支持的。幀動畫的實現離不開狀態機、而狀態機、動畫和狀態切換（transition

（四）： Flink1.6.1 standalone叢集模式安裝部署，幾個常用引數配置

NameNode檢查點異常

Flink1.6.1安裝

前提

配置Flink

配置master節點

JVM記憶體

slaves

taskmanager.numberOfTaskSlots

jobstore.cache

臨時I/O目錄

啟動叢集

將JobManager / TaskManager例項新增到群集

Maven依賴

參考

相關推薦