資料搬遷,從GCP Storage 遷移到阿里雲儲存(OSS) « 關於網路那些事...
阿新 • • 發佈:2018-12-20
通常在建構系統中,擴充新服務,在遷移過程,有時會需要將雲端資料進行搬移
最近剛好一個系統需要將GCP上面的Storage資料遷移到阿里雲OSS
在這裡做一個紀錄
使用工具
OssImport
這裡是官方介紹:
OssImport工具可以將本地、其它雲端儲存的資料遷移到OSS,它有以下特點:
支援的豐富的資料來源,有本地、七牛、百度BOS、AWS S3、Azure Blob、又拍雲、騰訊雲COS、金山KS3、HTTP、OSS等,並可根據需要擴充套件;
支援斷點續傳;
支援流量控制;
支援遷移指定時間後的檔案、特定字首的檔案;
支援並行資料下載、上傳;
支援單機模式和分散式模式,單機模式部署簡單使用方便,分散式模式適合大規模資料遷移。
環境
需要安裝 JAVA 7 以上的環境
模式
在 OssImport 提供單機跟分散式 兩種資料遷移方式
如果資料是 30TB以內的小規模資料遷移,可以下載單機版
資料超過 30TB 以上,則適合分散式遷移方式,可以下載分散式版
分散式遷移的概念如下:
在這裡,我所使用的是單機版 ossimport-2.3.1
下載之後,解壓縮可以看到檔案結構:
在這裡面可以看到幾個指令碼檔案
一鍵匯入指令碼: import.sh (or import.bat)
分散式執行指令碼:console.sh (or console.bat)
另外有一個設定檔,local_job.cfg 需要修改內容
設定完畢後,就可以開始執行指令碼,要留意的是,指令碼執行必須在 ossimport 目錄底下完成
如果你喜歡我們的文章內容,請在這裡按個讚
Tweet