1. 程式人生 > >Informatica支援 MySQL Community 版本的解決方案

Informatica支援 MySQL Community 版本的解決方案

Informatica Power Center 是一個 ETL 工具,提供強大的資料整合軟體和服務,一般用於大資料的抽取、轉換、載入,常應用於資料倉庫、BI 等領域,並支援各種主流的資料來源,如 Oracle、SQL Server、SaleForce、MySQL 等。本文主要分享 Informatica 在處理MySQL資料來源過程中遇到的一些問題,以及對應的解決方案(基於Windows)。

一、MySQL 社群版不支援的問題

雖然 Informatica 支援多種主流資料來源,但官方明確說明不支援 MySQL 社群版,不過通過其他途徑也能實現對 MySQL 社群版的支援,步驟如下:

1) 安裝 ODBC 驅動

首先,從MySQL官網下載社群版 ODBC Connector 驅動,32位和64位的都要下載,32位安裝在 Informatica Client,64位安裝在Informatica Sever。

2) Designer 配置 Data Source

Informatica Designer 用以匯入資料來源表、資料目標表、開發Mapping。現在要配置一個 MySQL 的資料來源,點選 Sources -> Import From DataBase,按如下圖所示:

結果 Informatica 報錯,還需要在Client端配置下 MySQL ODBC 驅動的支援。

3) Client 修改配置檔案

找到Informatica Client的安裝目錄,按如下圖所示的位置找到 powrmart.ini 檔案,新增內容如紅圈所示。

4) Informatica Workflow 配置 Connector

開發好的 Mapping,需要執行在 Workflow,這時候需要對 Mapping 對應的資料來源配置 Connector,以便支援 Workflow 的執行。開啟 Workflow 工具,配置 MySQL Connector,步驟如下所示:

上圖 Connect String 指的是 Server 要配置的系統DSN名稱。

5) Server 配置 DSN

在 Server 配置一個系統 DSN ODBC源(window server作業系統ODBC資料來源(32位)對應的是“ODBC資料來源”程式,

ODBC資料來源(64位)對應是“設定ODBC資料來源”,可以直接在開始選單搜尋“ODBC”),步驟如下所示:

二、中文亂碼的問題

Informatica 在對 MySQL 進行資料抽取時,比如從 SQL Server 抽取到 My SQL,或從 MySQL 抽取到 SQL Server。如果抽取資料時有中文亂碼問題,多半是字符集型別和資料表字段型別造成的,可以嘗試以下方法:

1) 字符集設定檢查

在 Informatica Workflow 的 Connector 對資料來源配置相應的字符集型別,一般 MySQL 是UTF8,在 Connector 配置視窗的 Code Page 就選UTF8,如下所示:

2) 表字段型別

MySQL 如果是 Varchar,SQL Server 對應的欄位需要定義為 Nvarchar,Varchar 是以 UTF8 儲存資料的,Nvarchar 是以 GBK 儲存的。