使用sqoop將HDFS資料匯出到RDBMS，map100%reduce0%問題

阿新 • • 發佈：2019-01-16

time：2016/12/29

場景：將hive中的資料匯出到oracle資料庫中
遇到的問題：
使用oozie跑job的時候，一直處於running狀態。實際上資料量很小，而且語句也不復雜。
檢視日誌發現mapreduce卡在reduce階段，如圖：

map100% reduce0%！

此時我首先想到的是叢集資源問題，因為這是公司測試環境，上面跑的任務太多。於是就放著等。過了很久仍然沒有動靜（排除跑的過慢問題）；
中間重新跑了job，沒用（排除偶然卡死問題）；
讓管理員清理了下系統磁碟空間。因為磁碟使用率已經達到了96%。同時跑了下其他的指令碼發現可以跑（排除環境問題）；
把job放到了開發環境上跑，發現一下就跑過去了（排除了指令碼問題）；
此時，想到了資料可能有問題。於是我把測試環境的資料放到開發環境，發現果然不能跑。那麼就是資料的問題！
最後想到了我hive中null資料是不是在oracle是主鍵？連上oracle後看到，果然是這個原因。而且不止主鍵，還有四個欄位也都不能為空。

在模擬hive表中資料的時候，我使用了null as list_in_id，雖然list_in_id在hive中可以任意值，但是在oracle卻是主鍵！這樣的資料
根本無法插入到oracle中，所以reduce一直處於0%.

修改list_in_id欄位後，資料終於匯出到oracle了！

使用sqoop將HDFS資料匯出到RDBMS，map100%reduce0%問題

使用sqoop將HDFS資料匯出到RDBMS，map100%reduce0%問題

sqoop 將hive資料匯出mysql,map reduce卡住問題

Sqoop_詳細總結使用Sqoop將HDFS/Hive/HBase與MySQL/Oracle中的資料相互匯入、匯出

使用sqoop將mysql 資料匯入hdfs時各種報錯

使用sqoop將oracle資料匯入hdfs叢集

Sqoop_具體總結使用Sqoop將HDFS/Hive/HBase與MySQL/Oracle中的數據相互導入、導出

資料匯出8，如何檢查oracle的歸檔空間是否滿了

利用sqoop將hive資料匯入Oracle中（踩的坑）

通過sqoop將mysql資料匯入到hive中進行計算示例

python將Excel資料匯出幷儲存在json檔案中

利用sqoop將hive資料匯入Oracle中

Hbase之--------將Hdfs資料載入到Hbase資料庫中

JS 將Table資料匯出到Excel表

【python Excel】如何使用python將大量資料匯出到Excel中的小技巧之二

將Hdfs資料往Hbase表中匯入

用sqoop將oracle資料匯入Hbase 使用筆記

利用sqoop將hive資料匯入匯出資料到mysql

PHP 將大量資料匯出到 Excel 的方法

mapreduce 將hdfs資料逐行寫入mysql

利用DevExpress將DataTable資料匯出到Excel

使用sqoop將HDFS資料匯出到RDBMS，map100%reduce0%問題

相關推薦