1. 程式人生 > >ETL工具之Kettle的簡單使用一

ETL工具之Kettle的簡單使用一

ETL工具之Kettle將一個數據庫中的資料提取到另外一個數據庫中:

1.開啟ETL資料夾,雙擊Spoon.bat啟動Kettle

2.資源庫選擇,諾無則選擇取消

3.選擇關閉

4.新建一個轉換

5.配置所需資料庫

6.將需要進行提取的資料表,用表輸入得到

7.選擇源資料所在資料庫及表,sql語句可自己輸入

8.選擇需要提取到的目標資料庫及表(拖出來即可)

9.選擇所對應的表中的對應列

10.按住Shift鍵,點選表輸入拖到插入/更新

11.點選啟動即可進行轉換

相關推薦

開源ETL工具Kettle介紹

power 基本概念 lgpl hat free ipaddress 傳遞 高可用 apache What 起源 Kettle是一個Java編寫的ETL工具,主作者是Matt Casters,2003年就開始了這個項目,最新穩定版為7.1。 2005年12月,Kettle從

ETL工具Kettle的簡單使用一

ETL工具之Kettle將一個數據庫中的資料提取到另外一個數據庫中: 1.開啟ETL資料夾,雙擊Spoon.bat啟動Kettle 2.資源庫選擇,諾無則選擇取消 3.選擇關閉 4.新建一個轉換 5.配置所需資料庫 6.將需要進行提取的資料表,用表輸入得到

Centos7下ETL工具kettle安裝

1.安裝包下載https://sourceforge.net/projects/pentaho/files/latest/download?source=files2.安裝依賴包將下載的包解壓後,執行spoon.sh需安裝libwebkitgtk依賴包yum -y insta

大數據ETL工具Kettle的--1功能介紹

excel lin ice server 作業 rac 創造力 操作系統 pan   Kettle是一款國外開源的ETL工具,純java編寫,可以在Window、Linux、Unix上運行。   說白了就是,很有必要去理解一般ETL工具必備的特性和功能,這樣才更好的掌握

開源ETL工具kettle系列常見問題

摘要:本文主要討論如何在你自己的Java應用程式中整合Kettle 如果你需要在自己的Java應用程式中整合Kettle , 一般來說有兩種應用需求,一種是通過純設計器來設計ETL轉換任務,然後儲存成某種格式,比如xml或者在資料庫中都可以,然後自己呼叫程式解析這個格式,執行這種轉換,是比較抽象的一種執行方

ETL工具Kettle數據的導入導出—Excel表到數據庫

data ttl 文件 啟動 連接 alt block 9.png etl 案例目的:當Excel中有幾萬條記錄或者更多數據時,使用Kettle導入到數據庫中。速度就能感到比復制粘貼快很多。 這裏我會演示將"data.xlsx"表中數據有15萬多條記錄,使用Kettle導

幾種 ETL 工具的比較(Kettle,Talend,Informatica 等)

調整 都是 acl 項目 talend 插件 str 操作 優化 成本: 軟件 成本包括多方面,主要包括軟件產品, 售前培訓, 售後咨詢, 技術 支持等。 開源 產品本身是免費的,成本主要是培訓和咨詢,所以成本會一直維持在一個較低水平。 商業產品本身價格很高,但是一般會提供

Linux文本處理工具grep sed

graph 不可 -i 並不會 以及 符號 簡化 哲學 末尾 Linux文本處理工具之grep sed 在Linux系統中,有一個哲學思想:Linux系統下,一切皆文件。由此可見,有關文本處理的工具有多重要,而我們經常用到文本處理工具主要有grep,sde,以及a

ETL工具kettle的csv輸入和excel輸入

vpd 分享 類型 需要 點擊 選擇 其他 exc 搜索 實際工作中我們可能回經常將excel或者csv的數據導入到數據庫中,這裏講下怎麽通過kettle進行導入;首先說下這兩種格式的區別:CSV是文本文件,用記事本就能打開,XLS是二進制的文件只有用EXCEL才能打同時C

ETL工具kettle怎麽進行增量數據抽取:一、通過標誌位

text term ESS log 繼續 需要 roc 默認值 RoCE 在平時的操作過程中可能大家需要經常進行增量的數據抽取,方法有很多種,接下來幾天講給大家介紹幾種我本人經常使用的幾種方式;首先給大家介紹我最喜歡的一種,就是通過標誌位;操縱方法如下,在源表中增加一個標識

ETL工具kettle怎麽實現增量數據抽取:二 時間戳

字段 ima 數據抽取 最好 工具 water 增量 -o ket 再進行增量數據抽取的時候,通過標誌位來進行之外,還可以通過時間戳,所謂的時間戳就是某個時間字段,最好每條記錄的該字段都是非空的;這種方法很簡單,就是在輸入的時候增加where條件;where條件語句就是一個

ETL工具kettle的數據分發和復制的區別

疑惑 image text 朋友 完全 color water mage vpd 大家在實際 操作過程中可能會出現一個這樣的情況,當你將一個組件與另一個組件進行連接時,會出現一個告知框,如圖這時候會讓你選擇分發或者復制,這時候很多朋友會疑惑,這倆有啥區別呢;當你的目標組件是

ETL工具kettle簡單的性能調優

轉換 src roc 設置 color -o 雜項 fff nag 一般有 幾項1.雜項,這個是設置的前一個步驟到下個步驟的緩存,默認是10000操作為,進入轉換,右鍵點擊空白處或者雙擊空白處,單擊的話進入設置,會出現如圖選擇雜項,主要設置‘記錄集合裏的記錄數’,可以適當的

ETL工具kettle怎麽做定時任務

是你 root用戶 com kit roc 觸發 不同版本 兩種 win kettle做定時任務平時任務中經常需要用兩種方法;一、kettle自帶的功能。具體操作如下:首先形成一個job,然後點擊開始組件;結果如圖:當需要定時時,那麽就是需要重復;此時勾選重復選項,然後點擊

ETL工具kettle怎麽將多個轉換集成到一個作業中

順序 tar size 作業 ext watermark mar proc 很多 在實際工作中,經常會出現很多個轉換,這樣管理成本會很高,那麽這時就可以采取一種方式將這些轉換集成到一個作業之中,可以看一個現成的例子,如圖我們在這一個作業中集成了四個轉換,有一點需要說明,就是

ETL工具kettle怎麽進行錯誤定義

輸出 nag tex vpd 需要 是我 oss 51cto proc 在實際操作過程中,數據有可能會報錯,這時我們可能會需要進行錯誤定義,所謂的錯誤定義就是怎麽對錯誤進行錯誤處理,這裏解說一種很基礎的錯誤處理,就是把錯誤輸出:這是我的 一個實際業務操作,大家可以看到在這中

ETL工具kettle的幾個小組件(剪切字符串,增加常量,計算器)

src 增加 一個 png 位置 就是 進行 http text 接下來幾天給大家介紹下幾個常用的kettle組件1.剪切字符串所謂的剪切字符串,就類似於Oracle的substr函數,具體位置在某個轉換的核心對象-轉換中,如圖使用方法為--雙擊打開組件,選擇你要裁剪的流字

ETL工具kettle的幾個小插件(字符串替換,字段選擇,將字段值設置為常量)

sha oracle rac 正則 com 修改字符集 繼續 kettle 輸出 繼續給大家介紹幾個小組件:一、字符串替換這個功能類似於oracle的replace函數,就是將某個字段的某些字符替換成我們給定的字符首先,選擇【輸入流字段】,【輸出流字段】自己命名(就是用來保

ETL工具kettle的組件--生成記錄

組件 它的 proc pro ima 記錄 自己的 kettle -o 今天介紹下kettle的一個比較實用的組件——生成記錄;當我們想將一部分文本數據變成數據行,每個字段作為一個數據行的一個列,那麽我們可以利用這個組件;它的位置在雙擊點開根據自己的實際需要進行設置當設置後

選用Kettle開源ETL工具應注意的問題

Kettle是一個Java編寫的ETL工具,從4.2版本開始遵守Apache Licence 2.0協議,最新穩定版為7.1。。Kettle在2006年初加入了開源的BI公司Pentaho, 正式命名為:Pentaho Data Integeration,簡稱“PDI”。自2017年9月20日起,P