[Spark]Spark-streaming通過Receiver方式實時消費Kafka流程（Yarn-cluster）

阿新 • • 發佈：2018-12-01

1.啟動zookeeper

2.啟動kafka服務（broker）

[[email protected] kafka_2.11-0.10.2.1]# ./bin/kafka-server-start.sh config/server.properties

3.啟動kafka的producer（前提：已經建立好topic

[[email protected] kafka_2.11-0.10.2.1]# ./bin/kafka-console-producer.sh --broker-list master:9092 --topic test

4.啟動kafka的consumer

[[email protected] 
 kafka_2.11-0.10.2.1]#./bin/kafka-console-consumer.sh --zookeeper master:2181 --topic test --from-beginning

5.打jar包，將帶有依賴的jar包上傳到叢集上

mvn clean assembly:assembly

6.編寫啟動指令碼，啟動任務 sh run_receiver.sh

/usr/local/src/spark-2.0.2-bin-hadoop2.6/bin/spark-submit\
        --class com.skyell.streaming.ReceiverFromKafka\
        --master yarn-cluster \
        --executor-memory 1G \
        --total-executor-cores 2 \
        --files $HIVE_HOME/conf/hive-site.xml \
        ./Spark8Pro-2.0-SNAPSHOT-jar-with-dependencies.jar

監控任務及檢視日誌

http://master:8088/cluster

關閉spark streaming任務

yarn application -kill application_1539421032843_0093

資料驅動變革-雲將個人部落格地址

[Spark]Spark-streaming通過Receiver方式實時消費Kafka流程（Yarn-cluster）

1.啟動zookeeper 2.啟動kafka服務（broker） [[email protected] kafka_2.11-0.10.2.1]# ./bin/kafka-server-start.sh config/server.properties 3.啟動kafka的producer（

通過FTP方式上傳資料夾（整個目錄）

可以利用下面的指令碼將資料夾從本地伺服器FTP上傳到遠端伺服器： #!/bin/bash #upload dir to remote ftp server read -p "Input local dir: " updir #local dir read -

spark streaming從指定offset處消費Kafka數據

tpc asi 4.2 nes 配置 sof 我們 erl examples spark streaming從指定offset處消費Kafka數據 2017-06-13 15:19 770人閱讀評論(2) 收藏舉報分類： spark（5）原文地址:htt

Spark中yarn模式兩種提交任務方式（yarn-client與yarn-cluster）

Spark可以和Yarn整合，將Application提交到Yarn上執行，和StandAlone提交模式一樣，Yarn也有兩種提交任務的方式。 1.yarn-client提交任務方式配置在client節點配置中spark-en

vertica系統管理語句 + vertica實時消費kafka

--看鎖表及鎖的型別 select object_name,lock_mode,transaction_id,request_timestamp,transaction_description from locks; select transaction_id from lo

Spark自定義累加器的實現需要注意的細節（java版）

可以參考下面博文！！！！！！需要注意的是，原始碼中給出也就是說兩個方法的實現是不一樣的。下面是我的實現 import constant.Constants; import org.apache.spark.AccumulatorParam;

Spark基本工作流程及YARN cluster模式原理(讀書筆記)

Spark基本工作流程及YARN cluster模式原理 Spark基本工作流程相關術語解釋 Spark應用程式相關的幾個術語： Worker：叢集中任何可以執行Application程式碼的節點，類似於YARN中的NodeManager節點。在Spark on Yarn模式中指的就是NodeMana

使用Java程式碼實現實時消費kafka的訊息

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/P

storm實時消費kafka資料

程式環境，在kafka建立名稱為data的topic,開啟消費者模式，準備輸入資料。程式的pom.xml檔案 <dependencies> <dependency> <groupId>org.

繞開SST通過IST方式添加Node到Percona XtraDB Cluster

amp repl stream -i png cache efault .cn defaults 繞開SST通過IST方式添加Node到Percona XtraDB Cluster Gcache存儲了所有的 writeset ,因此說這個集合的大小直接決定

通過公鑰解密密文思路（256bits RSA）

out 向導 star decrypt 選擇超級 cuda eric sta p { margin-bottom: 0.25cm; line-height: 120% } a:link { } 1.分解公鑰，分解出n與e: 　　1.1使用openssl（紅色標記是e與n）

ASP.NET如何禁止直接通過Url訪問某個型別的檔案（非許可權），不定時補充

Note：此處不是許可權設定問題，此處不是許可權設定問題，此處不是許可權設定問題！只是出於資料或者網路安全，禁止掃描工具直接掃描到某些包含敏感資訊的檔案，尤其比如日誌、配置等預設ASP.NET已經考慮到了一些安全問題，比如.config字尾的配置檔案，比如.cs的原始碼檔案，比如.log的日誌

Windows遍歷全盤所搜檔案，並通過多執行緒顯示搜尋進度（C++/C）

程式設計軟體，系統軟體：VS2017 工程屬性：MFC對話方塊（其他工程屬性稍作修改也適用）系統：windows10家庭版主要思想 1、利用CFileFind實現查詢檔案 2、利用遞迴實現全盤搜尋 3、多執行緒實現父對話方塊搜尋檔案時，子對話方塊顯示搜尋進度軟體執行效

三種方式列印楊輝三角形（JAVA實現）

1 //採用一個二維陣列列印楊輝三角 2 class Yanghui1 { 3 public static void main(String[] args) 4 { 5 //設定楊輝三角的行數 6 int num = 10

Java_53_陣列的三種初始化方式_陣列的界限（下標）

陣列初始化 1.靜態初始化除了用new關鍵字來產生陣列以外，還可以直接定義陣列的同時就為陣列元素分配空間並賦值。 int[] a={1,2,3}; Man[] mans={new Man(1,1),new Man(2,2)} 2.動態初始化陣列定義與為陣列元素分配空間

執行緒（二）：執行緒開啟方式與多執行緒（threading模組）

目錄執行緒的建立Threading.Thread類 1）執行緒的建立 2）多執行緒與多程序 3）Thread類的其他方法 4）守護執行緒 multiprocess模組的完全模仿了threading模組的介面，二者在使用層面，有很大的相似性，因而不再詳細介紹（官方連結）

樹莓派/PC實現實時攝像頭資料共享（Python—picamera）

上次實驗使用Python—OpenCV實現，發現傳輸效果並不是很理想，接下來使用Python和picamera實現樹莓派/PC實時攝像頭資料共享，主要也可分為伺服器和客戶端兩部分。伺服器Demo如下： import numpy as np import cv2 import socke

樹莓派/PC實現實時攝像頭資料共享（Python—OpenCV）

使用Python和OpenCV實現樹莓派/PC實時攝像頭資料共享，主要分為伺服器和客戶端兩部分。伺服器Demo如下： #伺服器端 import socket import threading import struct import time import cv2 import nu

類名獲取的幾種方式及單例模式（php語言）

文章來自：原始碼線上https://www.shengli.me/php/343.html 1.__CLASS__：獲取當前的類名 2.get_class()：返回物件的類名 3.get_called_class()：後期靜態繫

Spring Boot 初級入門教程（十七） —— 通過 Oracle 資料庫測試已整合 MyBatis（附原始碼）

在文章《Spring Boot 初級入門教程（十五） —— 整合 MyBatis》中，已經對 MyBatis 進行了整合，只是當時是連 MySQL 資料庫進行的測試。這一篇簡單通過 Oracle 資料庫進行測試，確保整合的 MyBatis 在連線 Oracle 資料庫時也是有效的。一、新增

[Spark]Spark-streaming通過Receiver方式實時消費Kafka流程（Yarn-cluster）

1.啟動zookeeper

2.啟動kafka服務（broker）

3.啟動kafka的producer（前提：已經建立好topic

4.啟動kafka的consumer

5.打jar包，將帶有依賴的jar包上傳到叢集上

6.編寫啟動指令碼，啟動任務 sh run_receiver.sh

監控任務及檢視日誌

關閉spark streaming任務

相關推薦