[CDH] CDH5整合Spark2.2後spark-shell啟動報錯解決

阿新 • • 發佈：2019-01-10

CDH5已整合Spark2.2，spark-shell啟動報錯：

[[email protected] bin]# ./spark2-shell 
Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/hadoop/fs/FSDataInputStream
	at org.apache.spark.deploy.SparkSubmitArguments$$anonfun$mergeDefaultSparkProperties$1.apply(SparkSubmitArguments.scala:124)
	at org.apache.spark.deploy.SparkSubmitArguments$$anonfun$mergeDefaultSparkProperties$1.apply(SparkSubmitArguments.scala:124)
	at scala.Option.getOrElse(Option.scala:121)
	at org.apache.spark.deploy.SparkSubmitArguments.mergeDefaultSparkProperties(SparkSubmitArguments.scala:124)
	at org.apache.spark.deploy.SparkSubmitArguments.<init>(SparkSubmitArguments.scala:110)
	at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:119)
	at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)
Caused by: java.lang.ClassNotFoundException: org.apache.hadoop.fs.FSDataInputStream
	at java.net.URLClassLoader.findClass(URLClassLoader.java:381)
	at java.lang.ClassLoader.loadClass(ClassLoader.java:424)
	at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:335)
	at java.lang.ClassLoader.loadClass(ClassLoader.java:357)
	... 7 more
[ 
[email protected] bin]#

原因分析：Spark1.4以後，所有spark的編譯都是沒有將hadoop的classpath編譯進去的。所以必須在spark-env.sh中指定hadoop中的所有jar包。

解決：去CM網頁上修改Spark2.2配置，指定SPARK_DIST_CLASSPATH，然後重啟過期配置。

export SPARK_DIST_CLASSPATH=$(${HADOOP_HOME}/bin/hadoop classpath)

再次啟動spark-shell，報錯已經不存在了

[[email protected] 
 bin]# ./spark2-shell 
Setting default log level to "WARN".
To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel).
Spark context Web UI available at http://192.168.1.8:4040
Spark context available as 'sc' (master = local[*], app id = local-1542104414574).
Spark session available as 'spark'.
Welcome to
      ____              __
     / __/__  ___ _____/ /__
    _\ \/ _ \/ _ `/ __/  '_/
   /___/ .__/\_,_/_/ /_/\_\   version 2.1.0.cloudera2
      /_/
         
Using Scala version 2.11.8 (Java HotSpot(TM) 64-Bit Server VM, Java 1.8.0_151)
Type in expressions to have them evaluated.
Type :help for more information.

scala> :q
[ 
[email protected] bin]#

參考官網： https://spark.apache.org/docs/latest/hadoop-provided.html

[CDH] CDH5整合Spark2.2後spark-shell啟動報錯解決

CDH5已整合Spark2.2，spark-shell啟動報錯： [[email protected] bin]# ./spark2-shell Exception in thread "main" java.lang.NoClassDefFoundError: org/apac

spark-shell啟動報錯解決辦法

spark-shell啟動報錯解決辦法: scala版本不相容問題這是因為加入了專案依賴庫到/usr/cwgis/app/spark/jars/lib/中刪除相關的scala開頭的jar檔案即可啟動spark-shell [[email protected] ~]# run

spark-shell啟動報錯：Yarn application has already ended! It might have been killed or unable to launch application master

name limits nor bsp closed pre opened 頁面 loading spark-shell不支持yarn cluster，以yarn client方式啟動 spark-shell --master=yarn --deploy-mode=cli

Error :spark-shell模式報錯：java.sql.SQLException: A read-only user or a user in a read-only database

1.問題描述：啟動spark-shell local的模式 bin/spark-shell --master local[2] 報錯： [[email protected] spark-2.1.0-bin-hadoop2.6]$ bin/spark-she

spark-shell 執行報錯 OutOfMemoryError

java.lang.OutOfMemoryError: unable to create new native threadat java.lang.Thread.start0(Native Method)at java.lang.Thread.start(Thread.java:714)at java.ut

hbase shell啟動報錯(KeeperException$ConnectionLossException）

hbase shell啟動報錯問題：執行hbase shell的時候報錯 org.apache.zookeeper.KeeperException$ConnectionLossException: KeeperErrorCode = ConnectionLoss for /hbase/

spark應用提交報錯解決

老樣子，菜雞一隻！如果有什麼說錯的，還請大家見諒~！！也希望大家幫我指出改正。本次測試的spark版本是2.2.X的，從打包開始，打包有兩種方式，一種是maven打包，一種是idea打包（據說這種打包方式叫SBT？maybe把），然後打出來的包也有兩種，一種叫胖包，一種叫瘦包。我先打了

升級node版本後VUE專案啟動報錯

檢視node版本： node -v 原來的node版本是8.11.3 升級後的node版本是10.13.0 啟動VUE專案 npm run dev 報錯： fs.js:129 throw new ERR_INVALID_CALLBACK(); ^ Typ

安裝Tensorflow後的執行例子報錯解決辦法

安裝好了Tensorflow，執行例子出現如下的錯誤： import tensorflow as tfhello = tf.constant('Hello ,TensorFlow')sess = tf.Sess

Spark Worker 啟動報錯：No subfolder can be created in

解決方案寫在前面：在spark-env.sh裡有個引數 SPARK_LOCAL_DIRS，是存放shuffle資料落盤的目錄，這個報錯就是這個目錄不存在導致的。建立目錄重啟worker，再將核數和記憶體均衡一下。附錄一下報錯： 18/03/29 09:59:01

myeclipse非正常關閉後啟動報錯解決方法

這段時間經常性遇到開機後myeclipse無法啟動報錯，前幾次按照網上的辦法刪除了plugins下所有檔案，雖然能啟動，但是所有的配置資訊以及專案都需要重新設定和匯入，讓我無比煩躁。就在剛才，下班回家後啟動myeclipse發現又報錯了。

.net core 釋出後的站點啟動報錯 An error occurred while starting the application.

錯誤原文如下： An error occurred while starting the application. NET Core 4.6.26328.01 X64 v4.0.0.0 | Microsoft.AspNet

[LDAP] CentOS7安裝OpenLDAP後啟動報錯解決

問題 CentOS7.3下yum線上安裝的openldap-servers-2.4.44-20.el7.x86_64，安裝配置完成後啟動報錯，報錯日誌： [[email protected] ~]# systemctl start slapd Job for slapd.ser

springboot整合rabbitmq執行中出現異常無限報錯解決

@Service public class Bookservice { @RabbitListener(queues = "antiguigu") public void receive(Book book, Channel channel, Message

多模組專案spring整合dubbo,服務方正常啟動,消費方啟動報錯解決記錄

服務方寫法: <dubbo:application name="babasport-service-product"/>  <!-- 叢集式配置:&l

清理登錄檔後，eclipse啟動報錯：JVM terminated. Exit code=1

JVM terminated. Exit code=-1-Xms40m-Xmx256m-Djava.net.preferIPv4Stack=true-XX:MaxPermSize=512m-Djava.class.path=D:/Develop/Php/eclipse/plugins/org.eclipse.

spark-shell啟動錯誤

HR driver 退出 HA invoke OS ctu adc default 18/06/24 16:41:40 ERROR spark.SparkContext: Error initializing SparkContext.java.net.BindExcept

scrapy shell 除錯報錯TypeError: module.init() takes at most 2 arguments (3 g iven)

1、使用scrapy shell的時候本人之前安裝了ipython，使用shell調式格式從>>>變成了【1】這種帶有ipython的格式，結果整齊度看起來比較舒服。 2、現在建立了crawl spider，同時進入到專案目錄，使用scrapy shell xxxxxxxx在c

Spark Shell啟動時遇到:14: error: not found: value spark import spark.implicits._ :14: error: not found: value spa

　　不多說，直接上乾貨！　　最近，開始，進一步學習spark的最新版本。由原來經常使用的spark-1.6.1，現在來使用spark-2.2.0-bin-hadoop2.6.tgz。前期部落格　　這裡我，使用的是spark-2.2.0-bin-hadoop2.6.tgz

spark-shell啟動中bug除錯（bug除錯）

報錯資訊： Exception in thread "main" java.io.IOException: Failed on local exception: com.google.protobuf.InvalidProtocolBufferException: Prot

[CDH] CDH5整合Spark2.2後spark-shell啟動報錯解決

相關推薦