1. 程式人生 > >Spark偽分散式安裝(一)

Spark偽分散式安裝(一)

筆者是在已安裝好的偽分散式Hadoop環境下安裝的Spark。虛擬機器環境為:centos7。

Hadoop版本號為:

[centosm@centosm spark]$ hadoop version
Hadoop 2.7.2

一、Spark偽分散式安裝

1、確定hadoop環境已安裝好

3、解壓spark壓縮包並重命名解壓後的檔名為spark

     tar -zvxf  spark-2.1.1-bin-hadoop2.7.tgz 

4、修改配置檔案

     cd /usr/local/spark
     cp ./conf/spark-env.sh.template
./conf/spark-env.sh spark-env.sh 檔案後追加如下語句 vi spark-env.sh export SPARK_DIST_CLASSPATH=$(/home/centosm/hadoopM/bin/hadoop classpath)

5、啟動spark,執行時出現下列問題

這裡寫圖片描述

解決:

vi  spark-config.sh
export JAVA_HOME=/usr/java/jdk1.8.0_91

6、執行spark自帶的一些小例子,如下計算 π 的近似值

[centosm@centosm spark]$ ./bin/run-example SparkPi
2>&1 | grep "Pi is roughly" Pi is roughly 3.1428357141785708

7、進入spark互動模式

[[email protected] spark]$ ./bin/spark-shell            
Setting default log level to "WARN".
To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel).
SLF4J: Class path contains multiple SLF4J bindings.
SLF4J: Found binding in
[jar:file:/home/centosm/spark/jars/slf4j-log4j12-1.7.16.jar!/org/slf4j/impl/StaticLoggerBinder.class] SLF4J: Found binding in [jar:file:/home/centosm/hadoopM/share/hadoop/common/lib/slf4j-log4j12-1.7.10.jar!/org/slf4j/impl/StaticLoggerBinder.class] SLF4J: See http://www.slf4j.org/codes.html#multiple_bindings for an explanation. SLF4J: Actual binding is of type [org.slf4j.impl.Log4jLoggerFactory] 17/06/22 14:51:48 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable 17/06/22 14:52:15 WARN metastore.ObjectStore: Failed to get database global_temp, returning NoSuchObjectException Spark context Web UI available at http://192.168.22.125:4040 Spark context available as 'sc' (master = local[*], app id = local-1498114310652). Spark session available as 'spark'. Welcome to ____ __ / __/__ ___ _____/ /__ _\ \/ _ \/ _ `/ __/ '_/ /___/ .__/\_,_/_/ /_/\_\ version 2.1.1 /_/ Using Scala version 2.11.8 (Java HotSpot(TM) 64-Bit Server VM, Java 1.8.0_91) Type in expressions to have them evaluated. Type :help for more information. scala>

在互動模式的情啟動的情況可以進入web頁面檢視相關資訊,如下:

這裡寫圖片描述

8、yum 安裝sbt

[centosm@centosm test]$ curl https://bintray.com/sbt/rpm/rpm > bintray-sbt-rpm.repo
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100   159    0   159    0     0     23      0 --:--:--  0:00:06 --:--:--    37
[centosm@centosm test]$
[centosm@centosm test]$ sudo mv bintray-sbt-rpm.repo /etc/yum.repos.d/
[root@centosm test]# yum install sbt
[centosm@centosm bin]$ sbt --version
Getting org.scala-sbt sbt 0.13.15  (this may take some time)...

相關推薦

Spark分散式安裝

筆者是在已安裝好的偽分散式Hadoop環境下安裝的Spark。虛擬機器環境為:centos7。 Hadoop版本號為: [centosm@centosm spark]$ hadoop version Hadoop 2.7.2 一、Spark偽分散式安裝

percona-xtrabackup安裝

mysql備份、innobackupex、percona-xtrabackupLinux系統環境:Red Hat Enterprise Linux Server release 6.5 (Santiago)MySQL版本:5.7.9 Source distribution1. Install the Perc

Spark轉GemFire任務

pin val found reg for ever have class chan ADMG-40 2.2.2.4 - Global Tax Warehouse (GTW) CoA mapping -- Both BtB and Project 1 Revision

redis安裝

adl mit lin limits edi out pan types serve 註:redis版本redis-4.0.2.tar.gz,操作系統centos7 1:解壓redis [root@docker3 local]# tar -zxvf redis-4.

System Center 2016 - Operations Manager 部署安裝

scom2016 operations manager system center 2016 今天很高興和大家一起探討一下關於 System Center 2016 - Operations Manager (俗稱SCOM2016)的部署安裝,也希望多多和大家一起討論學習。其實網上有一些關於SCO

linux系統程序安裝rpm工具

erl fields program 軟件 方法 owin lib 直接 源碼安裝 linux系統下程序安裝主要采用三種方式:1、rpm,有點類似.msi 和.exe比較類似,軟件包(相當於windows的某個程序的所有文件)的安裝路徑和文件名稱基本是固定的,但是他不會安裝

linux系統程序安裝yum工具

sync 內容 sim lean provide for 就是 grep 大型 yum安裝工具類似appstore,運用yum工具可以方便的下載所需的程序,同時yum工具會自動檢查程序的依賴關系,並安裝相應的依賴包,有點像windows的某些大型軟件安裝程序會自動檢查幫你安

System Center 2016 - Configuration Manager 部署安裝

style 管理員 擴展 管理中心 -c 還需 管理企業 roc 查詢 Hi 大家好,很高興今天和大家一起來學習探討一下 System Center 2016 - Configuration Manager , 其實一開始,我就要糾正一下我的這個叫法,不同於我之前分享給大家

SCVMM 2016 部署安裝

雲計算 雲平臺 Hi 大家好,今天準備和大家一起開始討論一下關於 System Center 2016 - Virtual Machine Manager (SCVMM 2016)的一些內容。System Center 2016 - Virtual Machine Manager 從字面上翻譯,是針對

spark源碼閱讀 啟動代碼閱讀

spark源碼閱讀 啟動代碼閱讀 spark啟動代碼閱讀: spark使用一系列的shell腳本作為入口:其中bin目錄下面是任務提交的腳本;sbin目錄是master和worker啟停相關的腳本。 而所有腳本最後都是通過調用bin/spark-class來實現對java(scala)代碼的調用。 -

Docker簡介與安裝

TP width Go src apache container 資源利用率 代碼托管 docker Docker簡介 Docker 是 Docker.Inc 公司開源的一個基於 LXC技術之上構建的Container容器引擎, 源代碼托管在 GitHub 上, 基於Go

spark RDD常用運算元

- filter 演算法解釋 filter 函式功能是對元素進行過濾,對每個 元 素 應 用 f 函 數, 返 回 值 為 true 的 元 素 在RDD 中保留,返回值為 false 的元素將被過濾掉。 內 部 實 現 相 當 於 生 成 FilteredRDD

搭建Hadoop分散式環境筆記

軟硬體環境 CentOS 7.2 64 位 OpenJDK- 1.8 Hadoop- 2.7 關於本教程的說明 雲實驗室雲主機自動使用 root 賬戶登入系統,因此本教程中所有的操作都是以 root 使用者來執行的。若要在自己的雲主機上進行本教程的實驗,為了系統安全,建議

分散式__基於Zookeeper實現可重入分散式

1  重入的實現 對於鎖的重入,我們來想這樣一個場景。當一個遞迴方法被sychronized關鍵字修飾時,在呼叫方法時顯然沒有發生問題,執行執行緒獲取了鎖之後仍能連續多次地獲得該鎖,也就是說sychronized關鍵字支援鎖的重入。對於ReentrantLock,雖然沒有像sych

11gr2RAC環境解除安裝

和以往版本相比,解除安裝RAC環境變得更加容易。 這一篇介紹RAC環境中DATABASE的解除安裝。     在解除安裝資料庫軟體之前,可以利用DBCA來刪除資料庫,也可以保留資料庫,通過解除安裝工具完成全部解除安裝工作。 bash-3.00# su - or

Oracle資料庫入門安裝

目錄 Oracle資料庫是什麼? Oracle資料庫和其他資料庫的區別是什麼? Oracle資料庫的安裝 解決方案[INS-13001]環境不滿足最低要求 配置安裝: 驗證oracle安裝成功 Oracle資料庫是什麼? Oracle Database

開發微信小程式-安裝

先註冊 https://mp.weixin.qq.com/wxopen/waregister?action=step1 下載小程式 https://developers.weixin.qq.com/miniprogram/dev/devtools/download.html?t=181012

01分散式基礎-分散式架構概述

一、分散式架構概述 什麼是分散式 分散式和叢集的關係 計算機的發展歷史 計算機的發展歷史 分散式架構的發展 架構的發展演變過程 第一版應用 第二版 單擊負載越來越高,資料庫伺服器和應用伺服器分離

Spark入門詳解-Spark簡介

個人部落格原文連結 簡介 Spark是基於記憶體計算的大資料分散式計算框架。Spark基於記憶體計算,提供可互動查詢方式,提供近實時處理方式,同時保證了高容錯性和高可伸縮性,允許使用者將Spark部署在大量廉價硬體之上,形成叢集。 Spark使用Scala語言進行實現,它是一種面

SQL追蹤器phpgjx2.0版本安裝

SQL追蹤器phpgjx2.0版本安裝 本文章主要解決在和資料庫打交道時,除錯資料庫成為佔據程式設計師開發時間的累贅,該神奇能夠實時顯示每一步對資料庫的操作,然後發現問題並定位,大量節約程式設計師的開發時間。先上圖感受一下: 該程式本質是一個基於php編寫的,