spark master註冊機制和主備切換原始碼

阿新 • • 發佈：2019-01-26

master啟動程式碼如下

override def onStart(): Unit = {
    logInfo("Starting Spark master at " + masterUrl)
    logInfo(s"Running Spark version ${org.apache.spark.SPARK_VERSION}")
    //啟動web頁面
    webUi = new MasterWebUI(this, webUiPort)
    webUi.bind()
    masterWebUiUrl = "http://" + masterPublicAddress + ":" + webUi.boundPort
    checkForWorkerTimeOutTask = forwardMessageThread.scheduleAtFixedRate(new Runnable {
      override def run(): Unit = Utils.tryLogNonFatalError {
        self.send(CheckForWorkerTimeOut)
      }
    }, 0, WORKER_TIMEOUT_MS, TimeUnit.MILLISECONDS)

    if (restServerEnabled) {
      val port = conf.getInt("spark.master.rest.port", 6066)
      restServer = Some(new StandaloneRestServer(address.host, port, conf, self, masterUrl))
    }
    restServerBoundPort = restServer.map(_.start())
    //啟動指標監控
    masterMetricsSystem.registerSource(masterSource)
    masterMetricsSystem.start()
    applicationMetricsSystem.start()
    // Attach the master and app metrics servlet handler to the web ui after the metrics systems are
    // started.
    masterMetricsSystem.getServletHandlers.foreach(webUi.attachHandler)
    applicationMetricsSystem.getServletHandlers.foreach(webUi.attachHandler)

    val serializer = new JavaSerializer(conf)
    //建立持久化引擎
    val (persistenceEngine_, leaderElectionAgent_) = RECOVERY_MODE match {
      case "ZOOKEEPER" =>
        logInfo("Persisting recovery state to ZooKeeper")
        val zkFactory =
          new ZooKeeperRecoveryModeFactory(conf, serializer)
        (zkFactory.createPersistenceEngine(), zkFactory.createLeaderElectionAgent(this))
      case "FILESYSTEM" =>
        val fsFactory =
          new FileSystemRecoveryModeFactory(conf, serializer)
        (fsFactory.createPersistenceEngine(), fsFactory.createLeaderElectionAgent(this))
      case "CUSTOM" =>
        val clazz = Utils.classForName(conf.get("spark.deploy.recoveryMode.factory"))
        val factory = clazz.getConstructor(classOf[SparkConf], classOf[Serializer])
          .newInstance(conf, serializer)
          .asInstanceOf[StandaloneRecoveryModeFactory]
        (factory.createPersistenceEngine(), factory.createLeaderElectionAgent(this))
      case _ =>
        (new BlackHolePersistenceEngine(), new MonarchyLeaderAgent(this))
    }
    persistenceEngine = persistenceEngine_
    leaderElectionAgent = leaderElectionAgent_
  }

在spark中，Application，driver，worker都可能會註冊到master上。

過程如下

1、Application註冊

    case RegisterApplication(description, driver) => {
      // TODO Prevent repeated registrations from some driver
      //如果master狀態為standby,就什麼都不做
      if (state == RecoveryState.STANDBY) {
        // ignore, don't send response
      } else {
        logInfo("Registering app " + description.name)
        //根據ApplicationDesc資訊和driver建立Application
        val app = createApplication(description, driver)
        //註冊ApplicationInfoDriver
        registerApplication(app)
        logInfo("Registered app " + description.name + " with ID " + app.id)
        //持久化ApplicationInfo到持久化引擎中
        persistenceEngine.addApplication(app)
        //向driver傳送，已經註冊的訊息
        driver.send(RegisteredApplication(app.id, self))
        //執行排程方法
        schedule()
      }
    }

通過程式碼可以看到，如果master是standby狀態，不做操作。

  private def registerApplication(app: ApplicationInfo): Unit = {
    val appAddress = app.driver.address
    if (addressToApp.contains(appAddress)) {
      logInfo("Attempted to re-register application at same address: " + appAddress)
      return
    }

    applicationMetricsSystem.registerSource(app.appSource)
    apps += app
    idToApp(app.id) = app
    endpointToApp(app.driver) = app
    addressToApp(appAddress) = app
    waitingApps += app
  }

這個方法就是把app資訊存入記憶體中。

driver.send(RegisteredApplication(app.id, self)) 這行程式碼，就是發訊息讓AppClient執行RegisteredApplication方法，告訴AppClient註冊完了。

關於這塊可以看另一篇部落格http://blog.csdn.net/zlx510tsde/article/details/78814717

      case RegisteredApplication(appId_, masterRef) =>
        // FIXME How to handle the following cases?
        // 1. A master receives multiple registrations and sends back multiple
        // RegisteredApplications due to an unstable network.
        // 2. Receive multiple RegisteredApplication from different masters because the master is
        // changing.
        appId.set(appId_)
        registered.set(true)
        master = Some(masterRef)
        listener.connected(appId.get)

作用就是把master和appId存入記憶體。

schedule方法用於啟動driver

  private def schedule(): Unit = {
    if (state != RecoveryState.ALIVE) { return }
    // Drivers take strict precedence over executors
    //隨機打亂所有worker
    val shuffledWorkers = Random.shuffle(workers) // Randomization helps balance drivers
    //雙重迴圈，所有等待的driver，如果worker的記憶體和cpu核數，大於driver需要的記憶體和cpu
    //就執行launchDriver方法
    for (worker <- shuffledWorkers if worker.state == WorkerState.ALIVE) {
      for (driver <- waitingDrivers) {
        if (worker.memoryFree >= driver.desc.mem && worker.coresFree >= driver.desc.cores) {
          launchDriver(worker, driver)
          waitingDrivers -= driver
        }
      }
    }
    //啟動worker上的executor
    startExecutorsOnWorkers()
  }

2、driver註冊

    case RequestSubmitDriver(description) => {
      if (state != RecoveryState.ALIVE) {
        val msg = s"${Utils.BACKUP_STANDALONE_MASTER_PREFIX}: $state. " +
          "Can only accept driver submissions in ALIVE state."
        context.reply(SubmitDriverResponse(self, false, None, msg))
      } else {
        logInfo("Driver submitted " + description.command.mainClass)
        //建立driver
        val driver = createDriver(description)
        //持久化driver
        persistenceEngine.addDriver(driver)
        //等待執行的driver列表+1
        waitingDrivers += driver
        drivers.add(driver)
        //執行schedule方法，啟動driver
        schedule()

        // TODO: It might be good to instead have the submission client poll the master to determine
        //       the current status of the driver. For now it's simply "fire and forget".

        context.reply(SubmitDriverResponse(self, true, Some(driver.id),
          s"Driver successfully submitted as ${driver.id}"))
      }
    }

3、worker註冊

case RegisterWorker(
        id, workerHost, workerPort, workerRef, cores, memory, workerUiPort, publicAddress) => {
      logInfo("Registering worker %s:%d with %d cores, %s RAM".format(
        workerHost, workerPort, cores, Utils.megabytesToString(memory)))
      if (state == RecoveryState.STANDBY) {
        context.reply(MasterInStandby)
      } else if (idToWorker.contains(id)) {
        context.reply(RegisterWorkerFailed("Duplicate worker ID"))
      } else {
        val worker = new WorkerInfo(id, workerHost, workerPort, cores, memory,
          workerRef, workerUiPort, publicAddress)
        //註冊worker
        if (registerWorker(worker)) {
          //持久化worker
          persistenceEngine.addWorker(worker)
          context.reply(RegisteredWorker(self, masterWebUiUrl))
          //執行schedule方法
          schedule()
        } else {
          val workerAddress = worker.endpoint.address
          logWarning("Worker registration failed. Attempted to re-register worker at same " +
            "address: " + workerAddress)
          context.reply(RegisterWorkerFailed("Attempted to re-register worker at same address: "
            + workerAddress))
        }
      }
    }

當master主備切換時，master呼叫如下方法

    case ElectedLeader => {
      //從持久化引擎中讀取持久化的app,driver,worker資訊
      val (storedApps, storedDrivers, storedWorkers) = persistenceEngine.readPersistedData(rpcEnv)
      state = if (storedApps.isEmpty && storedDrivers.isEmpty && storedWorkers.isEmpty) {
        RecoveryState.ALIVE
      } else {
        RecoveryState.RECOVERING
      }
      logInfo("I have been elected leader! New state: " + state)
      if (state == RecoveryState.RECOVERING) {
        //開始執行recovery
        beginRecovery(storedApps, storedDrivers, storedWorkers)
        recoveryCompletionTask = forwardMessageThread.schedule(new Runnable {
          override def run(): Unit = Utils.tryLogNonFatalError {
            //呼叫master的CompleteRecovery
            self.send(CompleteRecovery)
          }
        }, WORKER_TIMEOUT_MS, TimeUnit.MILLISECONDS)
      }
    }

在biginRecovery方法中

private def beginRecovery(storedApps: Seq[ApplicationInfo], storedDrivers: Seq[DriverInfo],
      storedWorkers: Seq[WorkerInfo]) {
    for (app <- storedApps) {
      logInfo("Trying to recover app: " + app.id)
      try {
        //app資訊加入master記憶體
        registerApplication(app)
        //App狀態都設定為UNKNOWN
        app.state = ApplicationState.UNKNOWN
        //向appClient傳送MasterChanged訊息，告訴app，master改變了
        //appClient收到訊息後，改變app的master地址，然後向Master傳送訊息MasterChangeAcknowledged
        app.driver.send(MasterChanged(self, masterWebUiUrl))
      } catch {
        case e: Exception => logInfo("App " + app.id + " had exception on reconnect")
      }
    }

    for (driver <- storedDrivers) {
      // Here we just read in the list of drivers. Any drivers associated with now-lost workers
      // will be re-launched when we detect that the worker is missing.
      drivers += driver
    }

    for (worker <- storedWorkers) {
      logInfo("Trying to recover worker: " + worker.id)
      try {
        //worker資訊加入master記憶體
        registerWorker(worker)
        //狀態設定為UNKNOWN
        worker.state = WorkerState.UNKNOWN
        //向worker傳送訊息MasterChanged,worker收到訊息後，改變worker的master地址
        //worker向master傳送訊息WorkerSchedulerStateResponse
        worker.endpoint.send(MasterChanged(self, masterWebUiUrl))
      } catch {
        case e: Exception => logInfo("Worker " + worker.id + " had exception on reconnect")
      }
    }
  }

MasterChangeAcknowledged和WorkerSchedulerStateResponse方法被呼叫，說明worker和app收到了master狀態改變的訊息，

並做了響應，所以在這兩個方法中，把worker和app的狀態設定為ALIVE。

最後在這兩個方法中都會呼叫completeRecovery方法，會刪除狀態仍為UNKNOWN的worker和app(如果現在狀態仍為UNKNOWN，

說明worker已經死了，或者app已經死了或者完成了)

private def completeRecovery() {
    // Ensure "only-once" recovery semantics using a short synchronization period.
    if (state != RecoveryState.RECOVERING) { return }
    state = RecoveryState.COMPLETING_RECOVERY

    // Kill off any workers and apps that didn't respond to us.
    workers.filter(_.state == WorkerState.UNKNOWN).foreach(removeWorker)
    apps.filter(_.state == ApplicationState.UNKNOWN).foreach(finishApplication)

    // Reschedule drivers which were not claimed by any workers
    drivers.filter(_.worker.isEmpty).foreach { d =>
      logWarning(s"Driver ${d.id} was not found after master recovery")
      if (d.desc.supervise) {
        logWarning(s"Re-launching ${d.id}")
        relaunchDriver(d)
      } else {
        removeDriver(d.id, DriverState.ERROR, None)
        logWarning(s"Did not re-launch ${d.id} because it was not supervised")
      }
    }

    state = RecoveryState.ALIVE
    schedule()
    logInfo("Recovery complete - resuming operations!")
  }

spark master註冊機制和主備切換原始碼

master啟動程式碼如下 override def onStart(): Unit = { logInfo("Starting Spark master at " + masterUrl) logInfo(s"Running Spark version

nginx健康檢查和主備切換

1、參考部落格 https://blog.csdn.net/moqiang02/article/details/42846221 2、使用第一種方式注意點在主備切換的方式下需要指定備用節點 upstream mysvr { server 192.168.0.104:8080;

Keepalived中Master和Backup主備切換機制淺析

keepalived priority weight BACKUP nginx 在keepalived的VRRP實例配置中會一般會設置Master和Backup來指定初始狀態，但是這並不意味著此節點一直就是Master角色。控制節點角色的是Keepalived配置文件中的“pr

spark原始碼分析之Master原始碼主備切換機制分析

Master原始碼分析之主備切換機制 1.當選為leader之後的操作 //ElectedLeader 當選leader case ElectedLeader => {

大話Spark(7)-原始碼之Master主備切換

Master作為Spark Standalone模式中的核心，如果Master出現異常，則整個叢集的執行情況和資源都無法進行管理，整個叢集將處於無法工作的狀態。 Spark在設計的時候考慮到了這種情況，Master可以起一個或者多個Standby Master，當Master出現異常的時候，Standy Ma

3--Master註冊機制源碼分析和狀態改變機制源碼分析

地址 mis 清空 finish accep same properly values pad 這部分直接看源碼會比較直觀!!! [註]本篇是對第二篇中間的Master狀態改變以及註冊機制進行剖析 master註冊機制原理圖如下 , 其實就是將Application信息

Master的註冊機制和狀態改變管理解密

發生接受發送空值 dto spa 就是 rem 9.png 本課主題 Master 接收 Worker, Driver, Application 註冊 Master 處理 Driver 狀態變換 Master 處理 Executor 狀態變換 Master 接

Spark核心原始碼深度剖析：Master註冊機制原理剖析與原始碼分析

1.Master註冊機制原理剖析（圖解） 2.部分原始碼分析 master.scala中的Application註冊原理程式碼分析： case RegisterApplication(

MySQL+MyCat實現讀寫分離和主備熱切換

配置MyCat的schema.xml檔案 <schema name="TESTDB" checkSQLschema="false" sqlMaxLimit="100"> <tab

測試hadoop2.x HA主備切換遇到的問題和解決辦法 [

手動kill 主namenode後，備用namenode沒有主動從standby切換到active！！！解決辦法：在備用namenode上檢視 Hadoop-grid-zkfc-server102.log日誌，發現異常如下2016-10-16 00:09:32,465 WAR

Spark原始碼分析之Master註冊機制原理

一 Worker向Master註冊 1.1 Worker啟動，呼叫registerWithMaster，向Master註冊當worker啟動的時候，會呼叫registerWithMaster方法

zookeeper主備切換學習

sem ant gen pri print 建立 mode reat 調用今天了解了下Zookeeper的主備方案大致就是兩個應用運行後同時搶一個臨時節點，zookeeper可以保證只會有一個註冊成功這個節點，然後都對這個節點進行watch，監聽事件NodeDelete

Keepalived主備切換時執行腳本

Linux Keepalived 高可用定義通知腳本：notify_master <STRING>|<QUOTED-STRING>：當前節點成為主節點時觸發的腳本notify_backup <STRING>|<QUOTED-STRING>：當前節點

DG主備切換主要說明

DGalter system switch logfile; 切換主庫日誌 select max(sequence#) from v$archived_log; 對比主備庫日誌，同步才能做下一步 alter database commit to switchover to standby with sess

測試fFreeNas做快照和主備容災

管理安裝 storage 技術刪除必須 con bae png FreeNas使用ZFS文件系統，支持一些存儲虛擬化功能，如快照功能。為了保證數據可靠性，不會丟失，利用快照功能對數據進行定時自動快照保存，同時將快照同時復制同步到另一臺同樣的FreeNas存儲上，實現主

VRRP負載均衡及端口跟蹤實現主備切換

.com http 虛擬 1.2 shu color virt ges prior VRRP 實驗 1、實現PC1和PC2的流量分別走R1和R2，實現負載均衡2、跟蹤端口，當外部鏈路出現故障實現主備切換. R1#conf tR1(config)#interface

Zookeeper C++程式設計實戰之主備切換

預設zookeeper日誌輸出到stderr，可以呼叫zoo_set_log_stream(FILE*)設定輸出到檔案中還可以呼叫zoo_set_debug_level(ZooLogLevel)控制日誌級別！！！類CZookeeperHelper提供基於zookeeper的主備切換介面和讀

Data Guard主備切換

一、Switchover正常切換 1、主庫（1）、檢視主庫狀態及角色 SQL> select name,database_role from v$database; NAME DATABASE_ROLE --------- ---------------

DATA GUARD 主備切換

一、Switchover正常切換 1、主庫（1）、檢視主庫狀態及角色 SQL> select name,database_role from v$database; NAME DATABASE_ROLE --------- ----------------

FreeSWITCH折騰筆記7——使用keepalived進行主備切換高可用部署

freeSWITCH的高可用部署方式有兩種：主備切換和負載均衡，官方文件介紹的主備切換部署是採用Corosync & Pacemaker，負載均衡採用前置opensips。但對使用keepalived進行主備切換的高可用方式沒有介紹，同時網上對該種部署方式也沒有介

spark master註冊機制和主備切換原始碼

相關推薦