1. 程式人生 > >Kettle案例總結一—多表連線(記錄集連線)

Kettle案例總結一—多表連線(記錄集連線)

Kettle是一款國外開源的ETL工具,純java編寫,可以在Window、Linux、Unix上執行,資料抽取高效穩定。

Kettle這個ETL工具集,它允許你管理來自不同資料庫的資料,通過提供一個圖形化的使用者環境來描述你想做什麼,而不是你想怎麼做。
Kettle中有兩種指令碼檔案,transformation和job,transformation完成針對資料的基礎轉換,job則完成整個工作流的控制。

使用kettle常見需求是要求從一個庫將資料抽取到另一個庫或將多張資料表資料關聯轉換後加載到另一張表中。前者只要一個表輸入連線到
一個表輸出即可,而後者相對略複雜一點。具體步驟總結如下:
1、兩張表資料連線:
這裡寫圖片描述


2、三張表資料連線:
這裡寫圖片描述

PS:在資料抽取過程中出現中文亂碼問題,可行解決辦法有:
開啟Spoon.bat,在if “%PENTAHO_DI_JAVA_OPTIONS%”==”” set PENTAHO_DI_JAVA_OPTIONS=”-Xms1024m” “-Xmx2048m” “-XX:MaxPermSize=256m”
後面加了”-Dfile.encoding=UTF-8”,再重啟即可解決亂碼。
這裡寫圖片描述