1. 程式人生 > >用Windows7+IDEA+SBT搭建Spark原始碼除錯與閱讀環境

用Windows7+IDEA+SBT搭建Spark原始碼除錯與閱讀環境

Spark原始碼是有Scala語言寫成的,目前,IDEA對Scala的支援要比eclipse要好,大多數人會選在在IDEA上完成Spark平臺應用的開發。因此,Spark原始碼閱讀的IDE理所當然的選擇了IDEA。今天將與大家分型Windows7+IDEA+SBT搭建Spark原始碼除錯與閱讀環境。

實驗環境準備:

JDK Java 語言的軟體開發工具包(SDK)

參考網址: http://www.oracle.com/technetwork/java/javase/downloads/index.html

IDEA有兩個版本:Ultimate Edition & Community Edition,後者是free的,而且完全能滿足學習者所有的需求

參考網址:http://www.jetbrains.com/idea/download/

ScalaSpark是用Scala語言寫成的,在本地編譯執行需要這個包

參考網址:http://www.scala-lang.org/download/

SBTscala工程構建的工具

參考網址:http://www.scala-sbt.org/download.html

GitIDEA自動下載SBT外掛時可能會用到的工具

參考網址:http://git-scm.com/download/

參考網址:http://git-scm.com/download/

第一部分:下載安裝如上軟體並實驗環境測試準備:

JDK軟體驗證測試

完成後,在windows命令列中輸入Java -version,檢查是否識別此命令。
如果不識別,檢視環境變數Path中是否有....\jdk\bin(我的電腦右鍵,屬性 -> 高階系統設定 -> 環境變數),如果沒有,自己手動新增Scala資料夾下的bin目錄的路徑。


Scala軟體驗證測試

完成後,在windows命令列中輸入scala,檢查是否識別此命令。
如果不識別,檢視環境變數Path中是否有....\scala\bin(我的電腦右鍵,屬性 -> 高階系統設定 -> 環境變數),如果沒有,自己手動新增Scala資料夾下的bin目錄的路徑。

 

SBT軟體驗證測試:

執行SBT的安裝程式,執行完成後,重新開啟windows命令列,輸入sbt,檢查是否識別此命令。沒有的話,手動配置環境變數,新增...\sbt\bin

執行完SBT的安裝程式之後,並不意味著完成了sbt的安裝,在windows命令放下輸入sbt後,SBT會自動的下載安裝它所需要的程式包,請耐心等待全部下載成功。



Git軟體驗證測試:

執行Git的安裝程式,安裝完成後,重新開啟windows命令列,檢查時候識別git命令。或者直接啟動GitHub,Inc/Git Shell程式。


安裝IDEA軟體

按要求直接安裝即可。

第二部分:IDEA的Scala外掛安裝:

1、選擇FileàSetting


2、選擇右側的 Install Jetbrains Plugin, 在彈出視窗的左側輸入scala,然後點選安裝,如下圖所示。


3、scala外掛安裝結束,需要重啟idea生效

第三部分:加壓縮官網下載的原始碼包或者找到通過Git抽取的Spark原始檔:

         我用的是spark-1.1.1版本(最新版本),由於idea 13已經原生支援sbt,所以無須為idea安裝sbt外掛。

原始碼下載(用git工具):

# Masterdevelopment branch

gitclone git://github.com/apache/spark.git

# 1.1 maintenancebranch with stability fixes on top of Spark 1.1.1

gitclone git://github.com/apache/spark.git -b branch-1.1

原始碼更新(用git工具同步跟新原始碼):

gitclone https://github.com/apache/spark.git

註解:這用IDEA匯入Spark原始碼時,可以省略下面這些操作,可以直接進入第四部分,實際上在用IDEA匯入Spark原始碼時,裡面了包含了如下操作,即生成idea工程(記得是進入原始碼專案中,我下載的原始碼放在E:\Spark計算框架的研究\spark_1_1_1_idea資料夾中),命令如下:

先用命令sbt,之後用命令gen-idea,如下圖所示:



出現如下錯誤:



錯誤原因及解決方案由於檔案路徑中出現了中文,解決方案,將中文路徑改為英文路徑。

第四部分:在IDEA中匯入Spark工程

1、在主介面的選單欄File下,選Import Project,找到解壓之後的spark工程資料夾,我暫時選的為(E:\Spark計算框架的研究\spark_1_1_idea)資料夾。

(解壓縮的Spark原始碼可以先不用sbt工具生成ieda工程的,IDEA內在匯入檔案時,直接包含了sbt生成idea工程的功能)

2、選擇專案型別為sbt project,然後點選next。(這個選項只有在安裝了IDEA的Scala外掛才會有)。


3、確定SBT project專案的位置,(註解:有些blog說是——選擇Project SDKJDK,不解,我在此標明一下),最好勾上Use auto-import,然後點選Finish。這時,IDEA會自動下載安裝SBT所需的各個包,沒有裝Git的話可能會報錯。

第一次解釋後,出現如下錯誤。


繼續操作一遍出現如下錯誤:(註解:和單獨用cmd命令sbt,之後gen-idea,是一樣的錯誤)


錯誤原因及解決方案由於檔案路徑中出現了中文,解決方案,將中文路徑改為英文路徑。本文我從新解壓Spark-1.1.1.tgz原始碼放入如下路徑(E:\spark_1_1_1_idea_English),按第四部分中的1,2,3再重複操作一篇。操作成功了。如下所示:

4、匯入完成

匯入完成後,自動開啟工程,要等一段時間,等待sbt對這個工程進行編譯。編譯完成後出現如下視窗。在出現的視窗中就可以進行Spark原始碼進行研究了,是不是感覺很有成就感,現在就開始研究只有2萬行左右的Spark核心原始碼吧。如果你覺得白色背景不好看,可以換上很酷的黑色背景,設定步驟如下:

File à Settings à Appearance à Theme 選擇Darcula,之後重新啟動即可。



參考的Blog網址:

ApacheSpark原始碼走讀之18 -- 使用Intellij idea除錯Spark原始碼 - 徽滬一郎

Spark作業程式碼(原始碼)IDE遠端除錯-其它

Windows + IDEA + SBT 打造Spark原始碼閱讀環境 2014-10-15 by guozhongxin

Spark開發環境的配置

相關推薦

Windows7+IDEA+SBT搭建Spark原始碼除錯閱讀環境

Spark原始碼是有Scala語言寫成的,目前,IDEA對Scala的支援要比eclipse要好,大多數人會選在在IDEA上完成Spark平臺應用的開發。因此,Spark原始碼閱讀的IDE理所當然的選擇了IDEA。今天將與大家分型Windows7+IDEA+SBT搭建Spa

全面理解EOS——5.EOS原始碼除錯閱讀

EOS的理解離不開原始碼的閱讀,而單步除錯能在閱讀原始碼出現困惑時為你解開迷霧。 每個人在不同系統下都有自己的喜歡的工具來閱讀原始碼,如在Windows下使用SourceInsight,跨平臺的開源工具Eclipse,還有收費的CLion等等,此處介紹並測試使

Eclipse構建Spark原始碼除錯閱讀環境

實驗環境準備: l  JDK: Java 語言的軟體開發工具包(SDK) 參考網址: http://www.oracle.com/technetwork/java/javase/downloads/index.html l  SaclaIDE:一個基於Eclipse開發的S

Windows上IDEA搭建最新Spark2.4.3原始碼除錯的開發環境

相信很多同學都想通過閱讀一些框架的原始碼,來提高自己的程式碼能力,但往往在第一步,搭建環境的時候就碰了壁。 本篇就來介紹下如何在Windows下,將最新版的Spark2.4.3編譯,並匯入到IDEA編譯器中。最後通過在IDEA執行Spark自帶的一共Example程式碼結尾。 1.搭建Spark原始碼環境所需

Windows和Linux中搭建PostgreSQL原始碼除錯環境

本文使用Xming、Putty和VMWare幾款工具,在Windows桌面環境呼叫Ubuntu虛擬機器上的圖形介面進行PostgreSQL原始碼的除錯。文中的所有步驟適合真機Ubuntu系統,只是所有圖形介面的呼叫是在Windows桌面環境下。這樣做,和直接在Ubuntu虛擬機器中進行除錯,並沒有什麼區別,只

Spark 原始碼除錯總結

最近在測試 Spark 2.3 的效能,其中踩的一些坑,除錯原始碼的一些技巧,適當記錄一下。本文是個人隨筆,也許邏輯不夠清晰,內容較多,敬請諒解。 首先 Spark 原始碼的基本斷點除錯,包括修改,仍然首推老大翟士丹的blog,其中有一些遠端除錯的操作。我們對於一個 S

IDEA搭建Java原始碼學習環境並上傳到GitHub上

開啟IDEA新建一個專案 建立一個最簡單的Java專案即可 在專案命名填寫該專案的名稱,我這裡寫的專案名為Java_Source_Study 點選Finished,然後在專案的src目錄下新建原始碼檔案存放的包,我這裡建立的包直接為source 專案結構構建好了,下面是原始碼的獲取 到本地

在IntelliJ IDEA中配置Spark(Java API)運行環境

appname java api ont lib with dep ava cat net 1. 新建Maven項目 初始Maven項目完成後,初始的配置(pom.xml)如下: 2. 配置Maven 向項目裏新建Spark Core庫 <?xml versi

IDEA快速搭建 SpringCloud 註冊中心

 第一步:建立 註冊中心(eureka)專案 按照以下步驟一步一步來(只是對於IDEA的初學者來說)       (我這裡選擇maven專案、比較方便) 給註冊中心專案 取上可愛的名稱        

Eclipse和wxpython搭建一個Python Gui程式開發環境

從今天凌晨2點到現在。花了幾乎20個小時的時間去研究py Gui程式的基本規則,然後為了用py2exe給程式打包,差點沒瘋掉。在此總結一下經驗。 1.py2exe的版本一定要和python的版本完全匹配,才能保證打包的順利進行。 2.用eclipse和wxpython搭建整合環境時應注意Path環境

Ubuntu+Spark+IDEA+SBT+scala專案搭建流程記錄

環境配置:自行配置好IDEA、jdk在spark官網下載spark-2.1.0-bin-hadoop2.7.tgz並解壓,執行spark-shell檢驗是否可用IDEA中新增SBT、scala外掛學習步驟建議:儘管網上很多寫好的演算法程式碼,spark初學者還是應從基本操作學

使用Intellij idea除錯Spark原始碼

前提 本文假設開發環境是在Linux平臺,並且已經安裝下列軟體,我個人使用的是arch linux。 jdk scala sbt intellij-idea-community-edition安裝scala外掛 為idea安裝scala外掛,具體步驟如下 選擇Fil

Intellij Idea搭建Spark開發環境

submit split des 出現 license tor lan jar word 在Spark高速入門指南 – Spark安裝與基礎使用中介紹了Spark的安裝與配置。在那裏還介紹了使用spark-submit提交應用。只是不能使用vim來開發Spark應用

spark JAVA 開發環境搭建及遠端除錯

spark JAVA 開發環境搭建及遠端除錯 以後要在專案中使用Spark 使用者暱稱文字做一下聚類分析,找出一些違規的暱稱資訊。以前折騰過Hadoop,於是看了下Spark官網的文件以及 github 上 官方提供的examples,看完了之後決定動手跑一個文字聚類的demo,於是有了下文。 1. 環境

Java虛擬機器(JVM原始碼):搭建OpenJDK(10)原始碼除錯環境

為什麼要自己除錯 在前面的文章,已經介紹了如何編譯自己的OpenJDK。 但是光擁有了自己的JDK版本肯定是不夠的。 為了深入瞭解Java例項的建立、初始化和執行流程以及內部實現原理,DEBUG是必不可少的必殺技。 所以,作為搞技術的有必要學習如何除錯JVM原始碼。

Spark核心原始碼Spark原始碼環境搭建

目錄 準備條件 下載spark原始碼,並解壓 開啟spark原始碼下的pom.xml檔案,修改對應的java和intellij裡的maven版本 開啟intellij,Inport Project,將原始碼匯入intellij中 問題總結(十分重要) Maven編譯打包前的準

八、window搭建spark + IDEA開發環境

mas span rgs oracl tps 文件 ide oracle -h 本文將簡單搭建一個spark的開發環境,如下: 1)操作系統:window os 2)IDEA開發工具以及scala插件(IDEA和插件版本要對應):   2-1)IDEA2018.2.1

基於idea搭建Hadoop原始碼閱讀環境

Hadoop原始碼是這麼做,其他原始碼環境也類似。 1、到官網下載Hadoop原始碼包,例如hadoop-2.6.5-src.tar.gz. https://www-eu.apache.org/dist/hadoop/common/hadoop-2.6.5/ 2、將下載的原始碼包解壓到某

Netflix Eureka原始碼除錯環境搭建

一:下載Gradle,從官網下載就可以了,非常簡單 (1)https://gradle.org/releases/,從這個地址去下載 (2)我下載的gradle-2.10-bin.zip,然後你找個目錄,解壓縮,比如我的目錄是:F:\development\gradle\

windows7搭建FTP伺服器並且python實現對FTP伺服器的一系列

0x00:windows7搭建FTP伺服器 前言:windows7搭建FTP伺服器,必須是專業版以上的windows7才可以。(不要問我為什麼,我也不知道,我找了很多Key才換成旗艦版) 點箭頭指向的地方,就能把windows7家庭普通版換成專業版甚至旗艦版了