Spark 引用ProtoBuffer報錯：Unable to find proto buffer class

阿新 • • 發佈：2019-01-01

使用 yarn 的spark-submit提交時，加入超序列化引數：

--conf spark.serializer=org.apache.spark.serializer.KryoSerializer \

另，附：Spark-submit提交作業的shell版本模板。

一個好的shell指令碼，不僅讓人看起來賞心悅目，更易於查詢問題，方便交接

#!/bin/sh

>>descripe
shell template
@author zjf
@date 2018-05-28
descripe

## source files
. /etc/profile
. ~/.bash_profile

## open spark GC log
export SPARK_SUBMIT_OPTS=" -Xloggc:tmp/gc_log -XX:+PrintGCApplicationStoppedTime -XX:+PrintGCDetails -XX:+PrintGCDateStamps -verbose:gc -XX:+UseGCLogFileRotation -XX:NumberOfGCLogFiles=10 -XX:GCLogFileSize=10M "

## args check
if [ $# -eq 0 ]
then
        CUR_DATE=`date -d "-1 day"  +%Y-%m-%d`
        CUR_PARTITION=`date -d "-1 day"  +%Y%m%d`
        BEGIN_PARTITION=`date -d "-1 day"  +%Y%m%d`
        END_PARTITION=`date -d "-1 day"  +%Y%m%d`
        BEGIN_DATE=`date -d "-1 day"  +%Y-%m-%d`
        END_DATE=`date -d "-1 day"  +%Y-%m-%d`
elif [ $# -eq 1 ]
then
        format_day=`echo $1|grep -o '[0-9]\{8\}'`
        format_hour=`echo $1|grep -o '[0-9]\{2\}$'`
        CUR_DATE=`date -d "$format_day" +%Y-%m-%d`
        CUR_PARTITION=`date -d "$format_day" +%Y%m%d`
        LAST_MONTH=`date -d "${format_day} -1 month" +%Y%m`
        BEGIN_DATE=`date -d "${format_day}"  +%Y-%m-%d`
        END_DATE=`date -d "${format_day}"  +%Y-%m-%d`
        BEGIN_PARTITION=`date -d "${format_day}"  +%Y%m%d`
        END_PARTITION=`date -d "${format_day}"  +%Y%m%d`
else
        echo "the args is wrong ,you should give it like '20170718'"
        exit 1;
fi

WORK_DIR=$(cd `dirname $0`; pwd)
BASH_DIR=$WORK_DIR/bin
DATA_DIR=$WORK_DIR/data/$CUR_PARTITION
LOGS_DIR=$WORK_DIR/log/$CUR_PARTITION

echo "CUR_DATE=${CUR_DATE}"
echo "CUR_PARTITION=${CUR_PARTITION}"
echo "LAST_MONTH=${LAST_MONTH}"
echo "BEGIN_PARTITION=${BEGIN_PARTITION}"
echo "END_PARTITION=${END_PARTITION}"
echo "BEGIN_DATE=${BEGIN_DATE}"
echo "END_DATE=${END_DATE}"

COMMAND="$1"
echo "RUN BATCH : ${COMMAND}"

class_home="cn.com.xiaomi.Test"

/home/zjf/bin/spark-submit \
        --cluster hadoopprc-hadoop-spark2.1 \
        --conf spark.yarn.job.owners=xxx \
        --conf spark.yarn.alert.phone.number=188888899 \
        --conf spark.yarn.alert.mail.address=' 
[email protected]' \
        --conf spark.serializer=org.apache.spark.serializer.KryoSerializer \
        --conf spark.storage.memoryFraction=0.5 \
        --conf spark.shuffle.memoryFraction=0.3 \
        --class ${class_home} \
        --master yarn  \
        --deploy-mode cluster \
        --queue production.queue..miui.game  \
        --conf spark.executor.extraJavaOptions=\"-XX:MaxDirectMemorySize=1024m\" \
        --conf spark.default.parallelism=1600 \
        --driver-memory 14g \
        --executor-memory 14g \
        --executor-cores 2 \
        --num-executors 400 \
        $WORK_DIR/huyu-cdi-spark-1.0-SNAPSHOT.jar \
        ${COMMAND}

Spark 引用ProtoBuffer報錯：Unable to find proto buffer class

使用 yarn 的spark-submit提交時，加入超序列化引數： --conf spark.serializer=org.apache.spark.serializer.KryoSerializer \ 另，附：Spark-submit提交作業的shell版本模板。

單元測試報錯：unable to find a @SpringBootConfiguration

問題描述今天做單元測試報錯：unable to find a @SpringBootConfiguration 問題原因有幾種可能性，逐個排除下對症下藥： 1.程式入口類忘了新增：SpringBootApplication註解 2.程式入口類的包名和測試

解決方法：配置群集時# gem install redis 報錯：Unable to require openssl, install OpenSSL and rebuild ruby

ttr 沒有就會由於 mic mas 可能 sage not 問題：前面已經在/usr/local/src安裝了ruby-2.3.0.tar.gz、rubygems-2.4.2.tar.gz。在配置 redis-3.1.1 群集中，使用gem install 安裝 ru

解決報錯：Unable to process Jar entry [org/springframework/jmx/export/annotation/*****]

proc ORC osi maven項目出現 pro date pos 啟動情況說明：從gitub上clone的maven項目，pox.xml配置中的依賴，自己的repository都有，所以正常update project ，正常clean，install，整個過程無

npm install總是報錯：unable to verify the first certificate（無法驗證第一證書）

解決方法一：取消ssl驗證：npm config set strict-ssl false 如果還沒成功，則將npm源更換為國內映象：npm config set registry http://registry.cnpmjs.org/ npm config set registr

secureCRT連線伺服器報錯：Unable to authenticate

用secureCRT連線遠端伺服器時報錯： 1 The client has disconnected from the server.Reason: 2 Unable to authenticate using any of the configured authentication methods

Keystone建立openstack service報錯：Unable to establish connection to http: //controller :35357/v3/service

httpd服務未啟動一、報錯資訊二、錯誤分析 Openstack Mitaka版一、報錯資訊 Keystone建立建openstack service報錯： Unable to establish connect

kafka連zk報錯：Unable to read additional data from server sessionid 0x0...

問題描述：主機資訊： IP hostname 10.0.0.10 host10 10.0.0.12 host12 10.0.0.13 h

Eclipse匯入別人的專案報錯：Unable to load annotation processor factory 'xxxxx.jar' for project

使用eclipse匯入別人的專案時候，報錯Unable to load annotation processor factory 'xxxxx.jar' for project。解決方案 1、專案右鍵——Properties 2、Java Compiler——A

執行geth attach報錯：Unable to attach to remote geth: no known transport for URL scheme "c"

在window10上執行get attach命令啟動互動式JavaScript環境連線到節點的時候，報錯Unable to attach to remote geth: no known transport for URL scheme "c"。但是在windows7或者geth1.8以前的版

iOS開發CocoPods支援報錯： [!] Unable to accept duplicate entry for: XXXXX (0.0.1)

在更新開源庫的時候報錯： [!] Unable to accept duplicate entry for: XXXXX (0.0.1) 意思是：不能接受同一版本的提交解決方案： 1、執行如下命令，

IntelliJ idea啟動tomcat報錯：Unable to ping server at localhost:1099 解決

提示資訊：Intellij IDEA Tomcat Application Server was not connected before run configuration stop, reason: Unable to ping server at localhost:1099

hive啟動報錯：Unable to instantiate SessionHiveMetaStoreClient

在配置完apache-hive-1.2.2之後，啟動hive，提示如下錯誤：Exception in thread "main" java.lang.RuntimeException: java.lang.RuntimeException: Unable to instantiate org.apache.h

Windows下安裝RabbitMQ報錯：unable to perform an operation on node時的解決方案

本文轉載自http://blog.csdn.net/seven_coder/article/details/79091934 找了很久才找到原博主的這個解決方案。故轉載到自己部落格裡，以待以後可以查看回憶。前言最近在Windows server 2012 R2

報錯：Unable to open serial port /dev/ttyUSB0 ubuntu或者 (ttyACM)

Unable to open serial port /dev/ttyUSB0 ubuntuUnable to open serial port /dev/ttyACM0 ubuntu這是由於沒有許可權的問題解決方法：開啟終端輸入：（若使用的是ttyACM將ttyus

IDEA報錯：Unable to save settings: Failed to save settings. Please restart IntelliJ IDEA

今天小鹹兒開啟Idea的時候，總是報錯：Unable to save settings: Failed to save settings. Please restart IntelliJ IDEA。經過排查和在網上查詢解決方法之後才知

虛擬機器報錯：Unable to open kernel device "\\.\VMCIDev\VMX": 重疊 I/O 操作在進行中

今天啟動虛擬機器突然出現： Unable to open kernel device "\\.\VMCIDev\VMX": 重疊 I/O 操作在進行中. Did you reboot after installing VMware Workstation? 這樣的報錯，

tomcat啟動報錯：Unable to complete the scan for annotations for web application

tomcat啟動報錯，具體報錯資訊如下： Unable to complete the scan for annotations for web application [/Ftrans] due to a StackOverflowError. Possible root

JanusGraph啟動ES報錯：Unable to determine Elasticsearch server version. Default to FIVE.

12:15:49 WARN org.janusgraph.diskstorage.es.rest.RestElasticSearchClient - Unable to determine Ela

sqoop接入kerberos安全認證後，本地執行正常，但提交到yarn上連線hive報錯： Unable to obtain password from user

日誌資訊： 2018-09-17 11:31:30,774 INFO [OutputFormatLoader-consumer] com.chinacreator.sqoop.connector.hive.HiveExecutor: 連線hive失敗java.io.IOExc

Spark 引用ProtoBuffer報錯：Unable to find proto buffer class

相關推薦