使用Intellij idea除錯Spark原始碼

阿新 • • 發佈：2019-02-09

前提本文假設開發環境是在Linux平臺，並且已經安裝下列軟體，我個人使用的是arch linux。

jdk
scala
sbt
intellij-idea-community-edition

安裝scala外掛為idea安裝scala外掛，具體步驟如下

選擇File->Setting

2 步驟2：選擇右側的Install Jetbrains Plugin，在彈出視窗的左側輸入scala，然後點選安裝，如下圖所示

3. scala外掛安裝結束，需要重啟idea生效由於idea 13已經原生支援sbt，所以無須為idea安裝sbt外掛。
原始碼下載和匯入

下載原始碼，假設使用git同步最新的原始碼

git clone https://github.com/apache/spark.git

複製程式碼

匯入Spark原始碼 1. 選擇File->Import Project, 在彈出的視窗中指定spark原始碼目錄

2. 選擇專案型別為sbt project，然後點選next

3. 在新彈出的視窗中先選中"Use auto-import",然後點選Finish

匯入設定完成，進入漫長的等待，idea會對匯入的原始碼進行編譯，同時會生成檔案索引。
如果在提示欄出現如下的提示內容"is waiting for .sbt.ivy.lock"，說明該lock檔案無法建立，需要手工刪除，具體操作如下

cd $HOME/.ivy2

rm *.lock

複製程式碼
手工刪除掉lock之後，重啟idea,重啟後會繼續上次沒有完成的sbt過程。
原始碼編譯使用idea來編譯spark原始碼，中間會有多次出錯，問題的根源是sbt/sbt gen-idea的時候並沒有很好的解決依賴關係。解決辦法如下， 1. 選擇File->Project Structures 2. 在右側dependencies中新增新的module,

選擇spark-core

其它模組如streaming-twitter, streaming-kafka, streaming-flume, streaming-mqtt出錯的情況解決方案與此類似。注意Example編譯報錯時的處理稍有不同，在指定Dependencies的時候，不是選擇Library而是選擇Module dependency,在彈出的視窗中選擇sql. 除錯LogQuery

1. 選擇Run->Edit configurations 2. 新增Application,注意右側視窗中配置項內容的填寫，分別為Main class， vm options, working directory, use classpath of module

-Dspark.master=local 指定Spark的執行模式，可根據需要作適當修改。
3. 至此，在Run選單中可以發現有"Run LogQuery"一項存在，嘗試執行，保證編譯成功。
4. 斷點設定，在原始檔的左側雙擊即可打上斷點標記，然後點選Run->"Debug LogQuery", 大功告成，如下圖所示，可以檢視變數和呼叫堆疊了。

使用Intellij idea除錯Spark原始碼

使用Intellij idea除錯Spark原始碼

使用 IntelliJ IDEA 匯入 Spark 最新原始碼及編譯 Spark 原始碼（博主強烈推薦）

Intellij Idea搭建Spark開發環境

Spark（八） -- 使用Intellij Idea搭建Spark開發環境

IntelliJ IDEA開發Spark、打JAR包

使用Intellij Idea搭建Spark開發環境

IntelliJ IDEA除錯視窗、幫助視窗、控制檯、搜尋框中文亂碼問題解決

使用Intellij Idea編寫Spark應用程式（Scala+SBT）

IntelliJ Idea開發spark程式及執行

遠端除錯spark原始碼（基於java的除錯工具）

ideallij除錯spark原始碼的n中方法

mac下Intellij IDEA檢視Java原始碼提示"Decompiled.class file, bytecode version:52.0 (Java 8)

intellij idea搭建spring原始碼閱讀環境

IntelliJ IDEA 除錯 Java 8 Stream，實在太香了！

用Windows7+IDEA+SBT搭建Spark原始碼除錯與閱讀環境

spark最新原始碼下載並匯入到開發環境下助推高質量程式碼(Scala IDEA for Eclipse和IntelliJ IDEA皆適用）（以spark2.2.0原始碼包為例）（圖文詳解）

在IntelliJ IDEA中配置Spark(Java API)運行環境

IntelliJ IDEA Spark程式本地模式執行消除日誌輸出INFO資訊

IntelliJ IDEA-2018.2檢視原始碼和當前類中所有的屬性和方法(十六）

Spark在Intellij IDEA中開發並執行

使用Intellij idea除錯Spark原始碼

相關推薦