各模式下執行spark自帶例項SparkPi

阿新 • • 發佈：2018-12-11

此係統是ubuntu，spark版本是1.0.0（下載的不是原始碼，而是編譯好的，在我的其他文章裡有下載網盤地址），hadoop版本2.2.0，scala版本2.10.4

1.spark-sunbmit命令：spark1.0之前的版本執行自帶例子使用$SPARK_HOME/bin/run-example命令，對於spark1.0以後做出了改進，使用$SPARK_HOME/bin/spark-submit命令。其實，spark-shell用到的就是通過spark-submit，之後呼叫spark-class函式來完成這些命令。具體可看下spark-submit.sh，會找到spark-class。

2.執行模式有很多模式，這裡就不一一介紹模式的執行原理，具體可去看下書。只看下執行模式的命令和結果。模式有：（1）local（本地）模式，（2）standalone模式，（3）on-yarn-cluster（on-yarn-standalone）模式，（4）on-yarn-client模式。

2.1 local模式在安裝的spark目錄下敲入命令：./bin/spark-submit --class org.apache.spark.examples.SparkPi --master local lib/spark-examples-1.0.0-hadoop2.2.0.jar 解釋下命令： --class 類名 --master local 本地模式 lib/spark-examples-1.0.0-hadoop2.2.0.jar 是你spark安裝目錄下的lib目錄下的examples的jar包，其實以後在windows上用intellij寫的spark程式也要打成jar包，放到這裡來呼叫。執行結果如下圖：

2.2 standalone模式首先進入spark安裝目錄下，啟動./sbin/start-all.sh，輸入jps，主節點看到Master,從節點看到worker 在安裝的spark目錄下敲入命令：./bin/spark-submit --class org.apache.spark.examples.SparkPi --master spark://192.168.123.101:7077 lib/spark-examples-1.0.0-hadoop2.2.0.jar 解釋下命令： --master spark://192.168.123.101:7077 這個IP是要寫你在spark的conf目錄下配置的export SPARK_MASTER_IP的地址。

前三種方式不需要啟動hadoop，spark有自己的資源管理模式

2.3 on-yarn-cluster模式大前提是master的機器和slave機器的系統時間要保持一致，不一致會有錯。首先要進入hadoop安裝目錄下，啟動./sbin/start-all.sh，看到主節點和namenode secondarynamenode resourcemanager master和從節點有datanode nodemanager worker 在安裝的spark目錄下敲入命令：./bin/spark-submit --class org.apache.spark.examples.SparkPi --master yarn-cluster lib/spark-examples-1.0.0-hadoop2.2.0.jar

2.4 on-yarn-client模式

大前提是master的機器和slave機器的系統時間要保持一致，不一致會有錯。要求和 on-yarn-cluster模式一樣。在安裝的spark目錄下敲入命令：./bin/spark-submit --class org.apache.spark.examples.SparkPi --master yarn-client lib/spark-examples-1.0.0-hadoop2.2.0.jar 所有執行模式命令都是參考Submitting Applications 網址：http://spark.apache.org/docs/latest/submitting-applications.html

---------------------

各模式下執行spark自帶例項SparkPi

此係統是ubuntu，spark版本是1.0.0（下載的不是原始碼，而是編譯好的，在我的其他文章裡有下載網盤地址），hadoop版本2.2.0，scala版本2.10.4 1.spark-sunbmit命令：spark1.0之前的版本執行自帶例子使用$SPARK_HOME/

Hadoop HA 模式下執行spark 程式

（1）將Hadoop的hdfs-site.xml 和core-site.xml檔案複製到spark/conf目錄下（2）追加如下內容到 spark-defaults.conf檔案 spark.files file:///home/hadoop/spar

關於：“無法序列化會話狀態。在“StateServer”或“SQLServer”模式下，ASP.NET 將序列化會話狀態物件，因此不允許使用無法序列化的物件或 MarshalByRef 物件。如果自定義會話狀態儲存在“Custom”模式下執行了類似的序列化

錯誤描述：無法序列化會話狀態。在“StateServer”或“SQLServer”模式下，ASP.NET 將序列化會話狀態物件，因此不允許使用無法序列化的物件或 MarshalByRef 物件。如果

各模式下執行spark自帶例項SparkPi

各模式下執行spark自帶例項SparkPi

Hadoop HA 模式下執行spark 程式

關於：“無法序列化會話狀態。在“StateServer”或“SQLServer”模式下，ASP.NET 將序列化會話狀態物件，因此不允許使用無法序列化的物件或 MarshalByRef 物件。如果自定義會話狀態儲存在“Custom”模式下執行了類似的序列化

Spark自帶的叢集模式（Standalone），Spark/Spark-ha叢集搭建

windows下使用php自帶的mail函式實現簡單的郵件傳送例項（QQ親試成功）

如何在命令列模式下執行帶包的java檔案

Spark自帶Pi程序運行

Loadrunner下WebTours系統自帶的用戶名和密碼

【9】Caffe學習系列：執行caffe自帶的兩個簡單例子

Hadoop本地執行模式下執行官方案例（Grep和WordCount）

IIS7的整合模式下如何讓自定義的HttpModule不處理靜態檔案（.html .css .js .jpeg等）請求

如何在無頭模式下執行WebDriver？

如何在無頭模式下執行WebDriver ？

redis使用管道和普通模式下執行效率的對比

Linux在命令列模式下執行命令

MapReduce 程式在 Windows 本地模式下執行報錯問題的解決

通過yarn執行spark作業應用例項

檔案重定向及VIM各模式下的快捷鍵使用

unity3d 非執行模式下執行指令碼

windows下執行spark程式

各模式下執行spark自帶例項SparkPi

相關推薦