1. 程式人生 > >大資料調錯系列之:自己總結的myeclipse連線hadoop會出現的問題

大資料調錯系列之:自己總結的myeclipse連線hadoop會出現的問題

在我們學習或者工作中開始hadoop程式的時候,往往會遇到一個問題,我們寫好的程式需要打成包放在叢集中執行,這無形中在浪費我們的時間,因為程式可以需要不斷的除錯,然後把最終程式放在叢集中即可。為了解決這個問題,現在我們配置遠端連線hadoop,遠端除錯的方法。

一段程式如下:獲取更多大資料視訊資料請加QQ群:947967114
大資料調錯系列之:自己總結的myeclipse連線hadoop會出現的問題大資料調錯系列之:自己總結的myeclipse連線hadoop會出現的問題
大資料調錯系列之:自己總結的myeclipse連線hadoop會出現的問題

當我們在執行的時候會有如下眾多的錯誤:

1、基礎環境配置:首先需要注意自己使用的hadoop的版本:
大資料調錯系列之:自己總結的myeclipse連線hadoop會出現的問題

這說明是2.6.0的所以需要下載一個連線包:hadoop-eclipse-plugin-2.6.0.jar,一定要注意根據自己的版本下載不同的連線包。放在myeclipse的安裝路徑下:D:\Program Files\Myeclipse-10
大資料調錯系列之:自己總結的myeclipse連線hadoop會出現的問題

Myeclipse-10和其他版本不同,是有兩個目錄的:其他版本只有一個目錄,直接進入找到plugins即可。這裡需要進入Common中找到plugins中,把連線包放在其中即可:
大資料調錯系列之:自己總結的myeclipse連線hadoop會出現的問題

然後把Myeclipse重啟。我們這個時候就可以進行hadoop的工程配置了:按照順序點選:
大資料調錯系列之:自己總結的myeclipse連線hadoop會出現的問題

在Browse中把解壓好的hadoop包引入進來,只引入到主目錄即可:然後就可以建立hadoop的,mapreduce工程了:獲取更多大資料視訊資料請加QQ群:947967114
大資料調錯系列之:自己總結的myeclipse連線hadoop會出現的問題
大資料調錯系列之:自己總結的myeclipse連線hadoop會出現的問題

完成後可以看到眾多的依賴包都自動進入了:

大資料調錯系列之:自己總結的myeclipse連線hadoop會出現的問題

然後我們配置遠端連線hadoop的目錄:

大資料調錯系列之:自己總結的myeclipse連線hadoop會出現的問題

新建一個:
大資料調錯系列之:自己總結的myeclipse連線hadoop會出現的問題

經過配置之後可以看到如下介面:

大資料調錯系列之:自己總結的myeclipse連線hadoop會出現的問題

能夠感受到已經連線到了hadoop的目錄了:

2、Exception in thread “main” java.lang.NullPointerException atjava.lang.ProcessBuilder.start

執行是出現如上錯誤:
大資料調錯系列之:自己總結的myeclipse連線hadoop會出現的問題

這個問題是Hadoop2以上版本,Hadoop2的bin目錄中沒有winutils.exe導致的錯誤。所以需要下載對應的包:
大資料調錯系列之:自己總結的myeclipse連線hadoop會出現的問題

注意一定要是64位的現在很少32位的了:如果兩個版本都可以:解壓並且把包裡的所有內容都複製出來分別放在自己的hadoop的bin解壓目錄中:
大資料調錯系列之:自己總結的myeclipse連線hadoop會出現的問題

然後把myeclipse對應的hadoop檔案重新引入一:獲取更多大資料視訊資料請加QQ群:947967114
大資料調錯系列之:自己總結的myeclipse連線hadoop會出現的問題

3、Exception in thread "main"java.lang.UnsatisfiedLinkError:

大資料調錯系列之:自己總結的myeclipse連線hadoop會出現的問題

4、main ExitCodeException

大資料調錯系列之:自己總結的myeclipse連線hadoop會出現的問題

這是因為window本地的hadoop沒有winutils.exe導致的.原來本地hadoop要去呼叫這個程式.我們先把上一部的winutils.exe檔案中例如hadoop.dll等所有檔案都放到c:\windows\System32,然後使得其執行沒錯才可以.

然而winutils.exe還是無法啟動,這個是某些電腦問題.有些人會遇到,雙擊winutils.exe執行報錯,缺少msvcr120.dll.下載之後再去啟動提示,“應用程式無法正常啟動0xc000007b”.這是記憶體錯誤引起的.下載DirectX_Repair修復directx解決問題,最後成功啟動了hadoop程式.

可能能夠啟動winutils.exe但還是不能正常跑應用程式,依然報錯,可以試試修改許可權驗證.

修改hadoop/etc/hadoop/hdfs-site.xml

新增內容:

<property>

<name>dfs.permissions</name>

<value>false</value>

</property>

5、atorg.apache.hadoop.io.nativeio.NativeIO$Windows.access遇到這個問題是由於原始碼檔案中需要更改:首先去官網下載hadoop-2.6.0-src.tar.gz原始碼包,解壓:hadoop-2.6.0-src\hadoop-common-project\hadoop-common\src\main\java\org\apache\hadoop\io\nativeio下NativeIO.java 複製到對應的Eclipse的project,然後修改557行為return true如圖所示:
大資料調錯系列之:自己總結的myeclipse連線hadoop會出現的問題

6、org.apache.hadoop.security.AccessControlException: Permissiondenied: user=zhengcy, access=WRITE,inode="/user/root/output"這是由於訪問許可權的問題。

有兩種解決方式:第一種把hadoop的目錄的許可權擴大:例如 hadoop chmod -R 777 /,都給所有許可權。第二種方式是修改配置檔案。去掉檢查許可權的步驟:在這個etc/hadoop下的hdfs-site.xml新增

  <property>

     <name>dfs.permissions</name>

     <value>false</value>

  </property>

7.獲取更多大資料視訊資料請加QQ群:947967114