大資料(二十五):Sqoop的介紹和安裝
阿新 • • 發佈:2018-11-10
一、Sqoop簡介
Sqoop是一種旨在有效的Hadoop和關係型資料庫等結構化資料儲存之間傳輸大量資料的工具。Sqoop的原理就是將匯入或者匯出命令翻譯成mapreduce程式來實現。在翻譯出的mapreduce中主要就是對inputformat和OutputFormat進行定製。
二、下載並解壓Sqoop
1.下載地址
http://mirrors.hust.edu.cn/apache/sqoop/1.4.6/
2.上傳安裝包到linux中
3.解壓安裝包
tar -zxvf sqoop-1.4.6bin_hadoop-2.0.4-alpha.tar.gz
4.移動解壓後的檔案到/usr/local下並改名為sqoop1.4.6
mv sqoop-1.4.6bin_hadoop-2.0.4-alpha /usr/local/sqoop1.4.6
三、修改配置檔案
1.進入sqoop目錄下的conf資料夾
2.將sqoop-env-template.sh和sqoop-site-template.xml分別重新命名為sqoop-env.sh和sqoop-site.xml
mv sqoop-env-template.sh sqoop-env.sh mv sqoop-site-template.xml sqoop-site.xml
3.修改sqoop-env.sh檔案
export HADOOP_COMMON_HOME=/usr/local/hadoop
export HADOOP_MAPRED_HOME=/usr/local/hadoop
export HIVE_HOME=/usr/local/hive
export ZOOCFGDIR=/usr/local/zookeeper3.4.8/bin
export ZOOKEEPER_HOME=/usr/local/zookeeper3.4.8
#如果還有HBASE就配置HBASEH_HOME
4.將jdbc的jar包拷貝到sqoop目錄下的lib資料夾中(Sqoop會用來用來控制mysql)
5.進入sqoop目錄下的bin資料夾執行幫助命令
./sqoop help
配置成功