Scala 開發Spark 基本模板

阿新 • • 發佈：2018-12-29

一、JDK安裝(略)

二、Scala安裝配置

2.1進入scala官網下載對應版本的scala 安裝包。

2.2 新建目錄

mkdir -p /usr/local/scala

2.2解壓

tar -zxvf scala-2.10.4.tar.gz -C /usr/local/scala

2.3配置環境變數

vi /etc/profile

#scala path
export SCALA_HOME=/usr/local/scala/scala-2.10.4
export PATH=$PATH:$SCALA_HOME/bin

source /etc/profile

2.4 在命令列輸入 scala 回車

三、新建maven專案

3.1 File > New > Project,

3.2 填寫maven基本資訊

3.3 選擇自己安裝的maven，自己配置的本地倉庫和settings.xml檔案

四、新增Scala的支援

4.1 在新建的專案右鍵選擇 AddFramework Support... > Scala

五、修改pom.xml檔案，增加Spark依賴支援

5.1增加阿里雲映象

<repositories>
        <repository>
            <id>aliyun</id>
            <url>http://maven.aliyun.com/nexus/content/groups/public/</url>
        </repository>
        <repository>
            <id>cloudera</id>
            <url>https://repository.cloudera.com/artifactory/cloudera-repos/</url>
        </repository>
        <repository>
            <id>jboss</id>
            <url>http://repository.jboss.com/nexus/content/groups/public</url>
        </repository>
    </repositories>

5.2 增加spark 依賴

<!--Spark Core-->
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-core_2.10</artifactId>
            <version>${spark.version}</version>
            <scope>compile</scope>
        </dependency>

        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-client</artifactId>
            <version>${hadoop.version}</version>
            <scope>compile</scope>
        </dependency>

5.3 新建一個scala檔案 ModuleSpark

/**
  * Created by dengwenqi on 2018/8/8
  * Spark Application  程式設計模板
  */
object ModuleSpark {

 /**
   * 如果Spark Application 執行在本地的話，Driver
   * @param args
   */
 def main(args: Array[String]): Unit = {
  /**
    * 從前面spark-shell命令列可知
    * Spark 資料分析的程式入口SparkContext,用於讀取資料
    */
  //讀取Spark Application 的配置資訊
  val sparkConf = new SparkConf()
          //設定SparkApplication名稱
          .setAppName("ModuleSpark Application")
          //設定程式執行的環境，通常情況下，在IDE中開發的時候，設定為local mode，至少是兩個Thread
          //在實際部署的時候通過提交應用的命令去進行設定
          .setMaster("local[2]")
  val sc = SparkContext.getOrCreate(sparkConf)

  /**==================================
    */
  /**
    * step1: read data
    * SparkContext 用於讀取資料
    */

  /**
    * step2:process data
    * RDD#transformation
    */

  /**
    * step3:write data
    * 將處理的結果資料儲存
    * RDD#action
    */


  /**
    * ========================
    */
  //在開發測試的時候，為了在每個Application頁面監控檢視應用中的Job的執行
  Thread.sleep(50000)
  //關閉資源
  sc.stop()





 }

Scala 開發Spark 基本模板

一、JDK安裝(略) 二、Scala安裝配置 2.1進入scala官網下載對應版本的scala 安裝包。 2.2 新建目錄 mkdir -p /usr/local/scala 2.2解壓 tar -zxvf scala-2.10.4.tar.gz -C /u

使用scala開發spark時，map+case結構使用技巧

scala開發Spark程式時使用map +case結構的一點小技巧 people.txt文字如下 lyzx1,19 lyzx2,20 lyzx3,21 lyzx4,22 lyzx5,23 ly

Scala in Spark 基本操作【未完】

# 建立textFileRDD val textFile = sc.textFile("README.md") textFile.first() #獲取textFile RDD的第一個元素 res3:String = # Apache

IDEA搭建scala開發環境開發spark應用程序

編寫運行程序通過 https apach import input inf 搭建一、idea社區版安裝scala插件因為idea默認不支持scala開發環境，所以當需要使用idea搭建scala開發環境時，首先需要安裝scala插件，具體安裝辦法如下。 1、

學習筆記:從0開始學習大資料-13. Eclipse+Scala+Maven Spark開發環境配置

上節配置好了spark執行環境，可以通過 spark-shell 在scala語言介面互動執行spark命令可以參照（ https://blog.csdn.net/u010285974/article/details/81840413 Spark-shell執行計算）

maven環境下使用java、scala混合開發spark應用

熟悉java的開發者在開發spark應用時，常常會遇到spark對java的介面文件不完善或者不提供對應的java介面的問題。這個時候，如果在java專案中能直接使用scala來開發spark應用，同時使用java來處理專案中的其它需求，將在一定程度上降低開發spark專案的

spark sql scala 開發環境搭建以及必要jar包匯入

1. scala 環境安裝及安裝（官網下載） 2.檢驗 scala 是否安裝成功 3.安裝 scala 整合開發環境 IDEA （官網自行下載安裝） 4.在 IDEA 上安裝 scal

scala開發快速入門 | 第二篇變數及基本資料型別

一、宣告值和變數 Scala中有兩種型別的變數。一種是val，是不可變的，在宣告時就必須被初始化，而且初始化以後就不能再賦值；另一種是var，是可變的，宣告的時候需要進行初始化，初始化以後還可以再次對其賦值。 Note：在專案的開發中建議使用val 也就是常量

Spark實戰----(1)使用Scala開發本地測試的Spark WordCount程式

第一步：JDk的安裝第二步：Scala的安裝不會的可以看這裡 Scala環境安裝鑑於以上兩步較為簡單，不再詳細贅述第三步：去Spark官方網站下載Spark包我下載的檔名是spark-1.6.2-bin-hadoop2.6 點選Dow

IDEA搭建scala開發環境開發spark應用程式

一、idea社群版安裝scala外掛因為idea預設不支援scala開發環境，所以當需要使用idea搭建scala開發環境時，首先需要安裝scala外掛，具體安裝辦法如下。 1、開啟idea，點選configure下拉選單中的plugins選項： 2、在彈出對話方塊中點選紅框按鈕： 3、在彈出最新對話

通過IDEA搭建scala開發環境開發spark應用程式

一、idea社群版安裝scala外掛因為idea預設不支援scala開發環境，所以當需要使用idea搭建scala開發環境時，首先需要安裝scala外掛，具體安裝辦法如下。1、開啟idea，點選configure下拉選單中的plugins選項：2、在彈出對話方塊中點選紅框按鈕：3、在彈出最新對話方塊的搜尋欄輸

IDEA+scala外掛開發spark程式

spark由scala語言編寫，開發spark程式，自然也少不了scala環境，這裡介紹如何利用Intellij IDEA開發spark。1、環境準備。jdk,scala,idea這些對於本文來說都已經預設安裝。2、idea中安裝scala language外掛。File-&

使用idea和maven開發和打包scala和spark程式

使用idea構建maven管理的scala和spark程式，預設已經裝好了idea、scala並在idea中安裝了scala外掛。一、新建Maven專案開啟idea，點選File—New—Project，彈出如下介面，選擇Maven專案，檢視是否是正確的JDK配置項正常來說這

【Spark深入學習-11】Spark基本概念和運行模式

nmf 磁盤大數據平臺並不是鼠標 .cn 管理系統大型數據集 spa ----本節內容------- 1.大數據基礎 1.1大數據平臺基本框架 1.2學習大數據的基礎 1.3學習Spark的Hadoop基礎 2.Hadoop生態基本介紹 2.1

spark基本組件與概念

維表優化 shu 合成 dag 優勢 lib task hive 數據結構核心之數據集RDD 俗稱為彈性分布式數據集。Resilient Distributed Datasets，意為容錯的、並行的數據結構，可以讓用戶顯式地將數據存儲到磁盤和內存中，並能控制數據的分區

Spark基本概念

ams lec all count 抽象類 sil 測試內容 pre Spark基本概念 1.SparkContent 　　a.Driver programs通過SparkContent對象訪問Spark 　　b.SparkContent代表和一個集群的鏈接　　c.在s

.NET開發設計模式-模板模式

sys pre exec namespace ace ext 模式 style nbsp using System; using System.Collections.Generic; using System.Linq; using System.Text; using

APP開發的基本流程

app框架審核需要上傳原型經理行為最終數量一個獨立App開發人的自白：做APP就是一場賭局，你要會押註下面我們就直接來看下APP從業者必知的整個APP開發標準流程。一般的APP開發及上線流程步驟如下：首先，制作一款APP，必須要有相關的id

spark2.x由淺入深深到底系列五之python開發spark環境配置

spark 大數據 rdd 開發環境 python 學習spark任何的技術前，請先正確理解spark，可以參考: 正確理解spark以下是在mac操作系統上配置用python開發spark的環境一、安裝pythonspark2.2.0需要python的版本是Python2.6+ 或者 P

scala & spark實戰

錯誤提示 replace nbsp pan tex stats sql mes int java.lang.Long is not a valid external type for schema of string java.lang.RuntimeException

Scala 開發Spark 基本模板

一、JDK安裝(略)

二、Scala安裝配置

三、新建maven專案

四、新增Scala的支援

五、修改pom.xml檔案，增加Spark依賴支援

相關推薦