1. 程式人生 > >Spark工作機制

Spark工作機制





spark作業:


Application : 使用者自定義的spark程式。使用者提交後,spark為app分配資源將程式轉換並執行。


Driver Program : 執行Application的main()函式並建立SparkContext。


RDD DAG : 當RDD遇到Action運算元,將之前的所有運算元形成一個有向無環圖(DAG)。再在Spark中轉化為job,提交到叢集進行執行。一個app中可包含多個job。


Job : 一個RDD Graph觸發的作業,往往由Spark Action運算元觸發,在SparkContext中通過runJob方法像Spark提交Job。

Stage : DAG Scheduler為每個Job會根據RDD寬窄依賴關係被切分很多個Stage,每個Stage中包含一組相同的Task,這一組Task也叫TaskSet。


Task : 一個分割槽對應一個Task,Task執行RDD中對應Stage中包含的運算元。Task Scheduler將Task封裝後放入Executor的執行緒池中之行。執行模式分為:FIFO(先進先出)與FAIR(公平排程)兩種模式。


總結:


job,stage,task之間的關係:


Job,Stage,Task是Spark任務執行流程中的三個基本單位。其中Job是最大的單位,Job是Spark應用的action運算元催生的;stage是由job拆分,在單個job內是根據shuffle運算元來拆分stage的,單個stage內部可以根據操作資料的分割槽數劃分多少個task。






一個application會啟動一個Driver Program,Driver Program會啟動多個job,一個job中又會根據RDD的依賴關係切分成不同的stage,stage之間形成一個DAG,DAG的每一個節點是一個stage,每個stage會生成一組TaskSet任務集,每一個Task對應一個block,在block塊上執行

相關推薦

Spark(四) -- Spark工作機制

一、應用執行機制 一個應用的生命週期即,使用者提交自定義的作業之後,Spark框架進行處理的一系列過程。 在這個過程中,不同的時間段裡,應用會被拆分為不同的形態來執行。 1、應用執行過程中的基本元件和形態 Driver: 執行在客戶端或者叢集中,執行A

Spark工作機制

spark作業:Application : 使用者自定義的spark程式。使用者提交後,spark為app分配資源將程式轉換並執行。Driver Program : 執行Application的main()函式並建立SparkContext。RDD DAG : 當RDD遇到A

Spark系列】三、Spark工作機制

Spark工作機制 Client Driver程式 Spark Context RDD DAG DAGSchedular TaskSchedular SparkEnv Worker Node

Spark工作機制詳解】 執行機制

Spark主要包括  排程與任務分配、I/O模組、通訊控制模組、容錯模組  、 Shuffle模組。 Spark 按照   ①應用  application  ②作業 job   ③ stage  ④ task   四個層次進行排程,採用經典的FIFO和FAIR等排程演

大資料學習筆記——Spark工作機制以及API詳解

Spark工作機制以及API詳解 本篇文章將會承接上篇關於如何部署Spark分散式叢集的部落格,會先對RDD程式設計中常見的API進行一個整理,接著再結合原始碼以及註釋詳細地解讀spark的作業提交流程,排程機制以及shuffle的過程,廢話不多說,我們直接開始吧! 1. Spark基本API解讀 首先我們寫

Spark Streaming的工作機制

系統 lan park 儀表 red 進行 工作 數據 現場 1. Spark Streaming的工作機制 Spark Streaming 是Spark核心API的一個擴展,可以實現高吞吐量的、具備容錯機制的實時流數據的處理。 支持從多種數據源獲取數

Spark架構與工作機制

Spark架構與工作機制 Spark的架構 — 架構元件概念簡介 Spark叢集中Master負責叢集整體資源管理和排程,Worker負責單個節點的資源管理。Driver程式是應用邏輯執行的起點,而多個Executor用來對資料進行並行處理。   Spark的構成:

Spark系列(三)Spark工作機制

什麼時候才能迴歸到看論文,寫感想的日子呀~剛剛交完房租的我血槽已空。看了師妹關於Spark報告的PPT,好懷念學生時代開組會的時光啊,雖然我已經離開學校不長不短兩個月,但我還是非常認真的翻閱了,並作為大自然的搬運工來搬運知識了。Spark的執行模式1、Local,本地執行,通

Hibernate 核心接口和工作機制

config hibernate bsp iter ans 安全 c api session tor 主要內容   Configuration類   sessionFactory接口   session接口   Transaction接口   Query 和 criteri

Binder的工作機制淺析

實體類 聲明 工作 xmanager 失敗 pri src android 底層 在Android開發中,Binder主要用於Service中,包括AIDL和Messenger,其中Messenger的底層實現就是AIDL,所以我們這裏通過AIDL來分析一下Binder的工

JavaScript工作機制:V8 引擎內部機制及如何編寫優化代碼的5個訣竅

with 由於 intern 但是 集成 項目 ssi 意義 實的 概述 JavaScript引擎是一個執行JavaScript代碼的程序或解釋器。JavaScript引擎可以被實現為標準解釋器,或者實現為以某種形式將JavaScript編譯為字節碼的即時編譯器。 下面是實

hadoop的NAMENODE的管理機制工作機制和DATANODE的工作原理

占用 最大 狀態 inux 自動 conda 文件大小 open() 格式 1:分布式文件系統(Distributed File System): (1):數據量越來越多,在一個操作系統管轄的範圍存不下了,那麽就分配到更多的操作系統管理的磁盤中,但是不方便管理和維護

[Java]I/O底層原理之二:Socket工作機制

tcp連接 fin 連接建立 src 並發 如果 send rec 轉換 一、TCP狀態轉化 TCP連接的狀態轉換圖如下 註:SYN 表示建立鏈接、FIN 表示關閉鏈接、ACK 表示響應、PSH 表示有數據傳輸、RST 表示鏈接重置。 CLOSED:初始狀態,在超時或

數據庫索引優化原理,索引的工作機制

更新 重點 黃金 在一起 view gen 一點 lan 成了 我們通過一個簡單的例子來開始教程,解釋為什麽我們需要數據庫索引。假設我們有一個數據庫表 Employee, 這個表有三個字段(列)分別是 Employee_Name、Employee_Age 和Employee

spring 內部工作機制(二)

出了 流水線 tor 應用程序 java反射機制 post 技術 process 加載 本章節講Spring容器從加載配置文件到創建出一個完整Bean的作業流程及參與的角色。 Spring 啟動時讀取應用程序提供的Bean配置信息,並在Spring容器中生成一份相應

JVM結構、GC工作機制詳解

固定 本地方法棧 內存池 為什麽 water aml 並且 兩種 數據區 轉自:http://blog.csdn.net/tonytfjing/article/details/44278233 JVM結構、內存分配、垃圾回收算法、垃圾收集器。下面我們一一來看。 一、JVM結

hadoop namenode datanode hdfs工作機制

node 節點 客戶 行合並 滿了 oop 重命名 技術 namenode   大家都知道namenode是hadoop中的一個很重要的節點,因為他存在著跟datanode的交互跟客戶端的交互,存儲著dotanode中的元數據,所以就很想學習他們是如何溝通並能保證數據在任何

Python全棧day18(叠代器協議和for循環工作機制

內部 highlight next 計算 內置函數 如何 異常 初始 一次循環 一,什麽是叠代和遞歸   遞歸和叠代都是循環的一種。   簡單地說,遞歸是重復調用函數自身實現循環。叠代是函數內某段代碼實現循環,而叠代與普通循環的區別是:循環代碼中參與運算的變量同時是保存結果

了解ViewFlipper工作機制

splay sdn ted runnable sent first per erp asf 平時我們在使用ViewFlipper的時候一方面感嘆ViewFlipper的使用很簡單,另一方面,我們時常感嘆ViewFlipper給我們的接口方法太少,很多常用的效果都不好做,很難

[翻譯] Python 3.5中async/await的工作機制

sum con trigger color 調用 普通 計算機程序 mom issue Python 3.5中async/await的工作機制 多處翻譯出於自己理解,如有疑惑請參考原文 原文鏈接 身為Python核心開發組的成員,我對於這門語言的各種細節充滿好奇。盡管我