1. 程式人生 > >Hadoop資料遷移MaxCompute最佳實踐

Hadoop資料遷移MaxCompute最佳實踐

本文向您詳細介紹如何通過使用DataWorks資料同步功能,將Hadoop資料遷移到阿里雲MaxCompute大資料計算服務上。

1.  環境準備

1.1 Hadoop叢集搭建

本文使用的EMR Hadoop版本資訊如下:

EMR版本: EMR-3.11.0

叢集型別: HADOOP

軟體資訊: HDFS2.7.2 / YARN2.7.2 / Hive2.3.3 / Ganglia3.7.2 / Spark2.2.1 / HUE4.1.0 / Zeppelin0.7.3 / Tez0.9.1 / Sqoop1.4.6 / Pig0.14.0 / ApacheDS2.0.0 / Knox0.13.0

Hadoop叢集使用經典網路,區域為華東1(杭州),主例項組ECS計算資源配置公網及內網IP,高可用選擇為否(非HA模式),具體配置如下所示。

1.2 MaxCompute

原文連結