1. 程式人生 > >ETL工具kettle的csv輸入和excel輸入

ETL工具kettle的csv輸入和excel輸入

vpd 分享 類型 需要 點擊 選擇 其他 exc 搜索

實際工作中我們可能回經常將excel或者csv的數據導入到數據庫中,這裏講下怎麽通過kettle進行導入;
首先說下這兩種格式的區別:CSV是文本文件,用記事本就能打開,XLS是二進制的文件只有用EXCEL才能打
同時CSV (*.csv) 文件格式只能保存活動工作表中的單元格所顯示的文本和數值。工作表中所有的數據行和字符都將保存。數據列以逗號分隔,每一行數據都以回車符結束。如果單元格中包含逗號,則該單元格中的內容以雙引號引起。
如果單元格顯示的是公式而不是數值,該公式將轉換為文本方式。所有格式、圖形、對象和工作表的其他內容將全部丟失。
若只是保存一點文本信息用 .csv文件就可以了 但是若有設定公式,凍結列等其他東西則用xls;
接下來說下兩者的具體用法:
csv輸入
打開一個轉換,點擊程序左邊的核心對象,在輸入中就可以看到,當然你也可以在左上方的步驟搜索中進行搜索;如圖:
技術分享圖片
將csv文件輸入組件拖到轉換中需要的位置;雙擊打開
技術分享圖片
點擊瀏覽添加文件,其他選項用默認就好,接下來點擊獲取字段,那麽就會獲取到相應的字段,也可以刪除自己不需要的字段,需要註意下類型,特別是涉及到number和date格式的時候註意下,還有右邊的去除空格,有時候csv中會存在大量的空格,你根據實際情況自己選擇;同時你也可以點擊預覽看下效果;最後點擊確定就好;還有一點文件編碼要選擇正確的,不然會出現中文亂碼;

excel輸入
前面步驟和csv輸入一樣,雙擊打開,如圖

技術分享圖片
首先選擇合適的表格類型,然後點擊瀏覽,選項文件,然後千萬記得點擊增加,記住;點擊增加後會在下面的選中的文件中可以看到,如果選錯了首先要在選中的文件中將它刪除;接下來點擊工作表,這是為了選中某一個sheet(一個表格可能會有多個sheet)
技術分享圖片
然後點擊字段,接下來步驟和csv輸入一樣了

ETL工具kettle的csv輸入和excel輸入