spark學習1——配置hadoop 單機模式並執行WordCount例項（ubuntu14.04 & hadoop 2.6.0）

阿新 • • 發佈：2019-02-03

1. 安裝SSH

hadoop是採用SSH進行通訊的，此時要設定密碼為空，即不需要密碼登陸，免去每次登陸時都要輸入密碼，當叢集較大時該步驟顯得尤為重要。

$ sudo apt-get install ssh

安裝完成後啟動服務：

$ /etc/init.d/ssh start

以下命令驗證服務是否正常啟動：

$ ps -e |grep ssh

設定免密碼登陸，生成私鑰和公鑰：

$ ssh-keygen -t dsa

此時會在～/.ssh中生成兩個檔案：id_dsa, id_dsa.pub，其中，id_dsa為私鑰，id_dsa.pub為公鑰，我們將公鑰追加到authorized_keys中，因為authorized_keys用於儲存所有允許以當前使用者身份登陸到ssh客戶端使用者的公鑰內容。

$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

登陸ssh：

$ ssh localhost

下圖為免密碼成功登陸後的結果：

$ exit 退出localhost。

2. 安裝rsync

通過以下命令安裝或更新rsync:

$ sudo apt-get install rsync

第一，從hadoop官網下載hadoop壓縮包，筆者下載的版本為 hadoop-2.6.0.tar.gz，將其解壓至/usr/local/下：

$ sudo tar zxvf /home/XXX/Downloads/hadoop-2.6.0.tar.gz -C /usr/local

第二，在hadoop-env.sh配置java安裝資訊，如下圖：

通過gedit 命令修改hadoop-env.sh檔案中的JAVA_HOME：

使用source命令使配置生效：（在/usr/local/hadoop-2.6.0/etc/hadoop下）

$ source hadoop-env.sh

為了使我們可以使用hadoop命令，修改 profile檔案中的PATH：

$ sudo gedit /etc/profile

如下圖：

重啟電腦使配置生效。

驗證hadoop版本資訊：

$ hadoop version

3. 執行hadoop 自帶的wordcount例項

$ cd /home/XXX/

$ mkdir hadoop

$ cd hadoop

$ mkdir input

在此目錄下建立任意多個文字檔案。

$ cd /usr/local/hadoop-2.6.0

$ bin/hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.6.0-sources.jar org.apache.hadoop.examples.WordCount /home/wuqh/hadoop_wuqh/input /home/wuqh/hadoop_wuqh/output

檢視輸出結果：

$ cat output/*

至此，單機模式的構建、配置和執行測試徹底成功！

參考文獻：《大資料Spark 企業級實戰》，電子工業出版社

spark學習1——配置hadoop 單機模式並執行WordCount例項（ubuntu14.04 & hadoop 2.6.0）

1. 安裝SSH hadoop是採用SSH進行通訊的，此時要設定密碼為空，即不需要密碼登陸，免去每次登陸時都要輸入密碼，當叢集較大時該步驟顯得尤為重要。 $ sudo apt-get install ssh 安裝完成後啟動服務： $ /etc/init.

Windows環境下搭建Hadoop(2.6.0）+Hive(2.2.0)環境並連線Kettle(6.0)

前提：配置JDK1.8環境，並配置相應的環境變數，JAVA_HOME 一.Hadoop的安裝　　1.1 下載Hadoop (2.6.0) http://hadoop.apache.org/releases.html 　　　　1.1.1 下載對應版本的winutils（https://gith

Hadoop3 在eclipse中訪問hadoop並執行WordCount例項

前言: 畢業兩年了，之前的工作一直沒有接觸過大資料的東西，對hadoop等比較陌生，所以最近開始學習了。對於我這樣第一次學的人，過程還是充滿了很多疑惑和不解的，不過我採取的策略是還是先讓環境跑起來，然後在能用的基礎上在多想想為什麼。通過這三個禮拜(基本上就是週六週日，其他時間都在

hadoop單機模式的構建、配置與執行測試步驟(ubuntu14.04)

PS：全程以root的角色進行配置安裝本篇文章的前期準備工作可以看我之前的部落格連結：參照上面兩篇文章，設定好機器環境和準備好檔案包，這篇文章是以下載好相應的jdk、hadoop檔案的

Spark on YARN模式的安裝（spark-1.6.1-bin-hadoop2.6.tgz + hadoop-2.6.0.tar.gz）（master、slave1和slave2）（博主推薦）

說白了　　Spark on YARN模式的安裝，它是非常的簡單，只需要下載編譯好Spark安裝包，在一臺帶有Hadoop YARN客戶端的的機器上執行即可。　　Spark on YARN分為兩種： YARN cluster（YARN standalone，0.9版本以前）和 YA

Hadoop單機模式配置和官方案例

Hadoop單機模式 1.環境準備 0.安裝jdk(自行安裝) 1.配置hadoop環境變數下載hadoop的Linux的安裝包，並解壓複製hadoop的解壓後的路徑

Hadoop單機模式安裝-(1)安裝設定虛擬環境

網路上關於如何單機模式安裝Hadoop的文章很多，按照其步驟走下來多數都失敗，按照其操作彎路走過了不少但終究還是把問題都解決了，所以順便自己詳細記錄下完整的安裝過程。此篇主要介紹如何在Windows環境下設定虛擬機器環境以及一些準備工作，熟悉WMware的朋友可以略過。我所記錄的筆記適合沒有Linux

Hadoop單機模式安裝-(3)安裝和配置Hadoop

網路上關於如何單機模式安裝Hadoop的文章很多，按照其步驟走下來多數都失敗，按照其操作彎路走過了不少但終究還是把問題都解決了，所以順便自己詳細記錄下完整的安裝過程。此篇主要介紹在Ubuntu安裝完畢後，如何進行Hadoop的安裝和配置。我所記錄的筆記適合沒有Linux基礎的朋友跟我一起操作，同時歡迎

Ubuntu 16.04下搭建基於攜程Apollo（阿波羅）配置中心單機模式

settings cal tro script fig setting col 文件夾 .gz 官網：https://github.com/ctripcorp/apollo Wiki：https://github.com/ctripcorp/apollo/wiki Is

CentOS 7 搭建基於攜程Apollo（阿波羅）配置中心單機模式

管理平臺 9.png ron 密碼修改 art onf ice spring pos Apollo（阿波羅）是攜程框架部門研發的配置管理平臺，能夠集中化管理應用不同環境、不同集群的配置，配置修改後能夠實時推送到應用端，並且具備規範的權限、流程治理等特性。服務端基於Sprin

Spark實戰(1) 配置AWS EMR 和Zeppelin Notebook

SparkContext和SparkSession的區別，如何取用？ SparkContext: 在Spark 2.0.0之前使用通過資源管理器例如YARN來連線叢集需要傳入SparkConf來建立SparkContext物件

三、Springboot學習1-配置-2018-11-13

1. 專案建立 1.1 訪問https://start.spring.io/，進行專案基礎配置，然後下載匯入到開發工具 1.2 專案介面如圖： 2. 引入web依賴

hadoop單機模式connect refused問題

所以說這裡一定要寫一下了，由於之前偷懶，在沒有執行hadoop自帶的jar包的情況下就配置了hadoop的core-site.xml和hdfs-site.xml導致單機模式執行hadoop就會出現connection refused的錯誤，因此將以前配置的內容刪除就可以了

Spark專案之環境搭建（單機）四 sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz 安裝

上傳解壓 sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz，重新命名 tar -zxf sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz mv sqoop-1.4.7.bin__hadoop-2.6.0 sqoop 進入sqoop

Hadoop HA 模式下執行spark 程式

（1）將Hadoop的hdfs-site.xml 和core-site.xml檔案複製到spark/conf目錄下（2）追加如下內容到 spark-defaults.conf檔案 spark.files file:///home/hadoop/spar

hadoop-2.6.0.tar.gz + spark-1.5.2-bin-hadoop2.6.tgz的叢集搭建（單節點）（Ubuntu系統）

前言關於幾個疑問和幾處心得！ a.用NAT，還是橋接，還是only-host模式？ b.用static的ip，還是dhcp的？答：static c.別認為快照和克隆不重要，小技巧，比別人靈活用，會很節省時間和大大減少錯誤。 d.重用起來指令碼語言的程式設計，如paython

hadoop-2.6.0.tar.gz + spark-1.6.1-bin-hadoop2.6.tgz的叢集搭建（單節點）（CentOS系統）

前言關於幾個疑問和幾處心得！ a.用NAT，還是橋接，還是only-host模式？ b.用static的ip，還是dhcp的？答：static c.別認為快照和克隆不重要，小技巧，比別人靈活用，會很節省時間和大大減少錯誤。 d.重用起來指令碼語言

Hadoop單機模式安裝-(2)安裝Ubuntu虛擬機器

網路上關於如何單機模式安裝Hadoop的文章很多，按照其步驟走下來多數都失敗，按照其操作彎路走過了不少但終究還是把問題都解決了，所以順便自己詳細記錄下完整的安裝過程。此篇主要介紹在虛擬機器設定完畢後，如何進行Ubuntu的安裝。我所記錄的筆記適合沒有Linux基礎的朋友跟我一起操作，同時歡迎高手參觀指

Hadoop-2.6.0+Zookeeper-3.4.6+Spark-1.5.0+Hbase-1.1.2+Hive-1.2.0叢集搭建

前言本部落格目的在於跟大家分享大資料平臺搭建過程，是筆者半年的結晶。在大資料搭建過程中,希望能給大家提過一些幫助，這也是本部落格的

[喵咪大資料]Hadoop單機模式

千里之行始於足下,學習大資料我們首先就要先接觸Hadoop,上節介紹到Hadoop分為Hadoop-HDFS,Hadoop-YARN,Hadoop-Mapreduce組成,分別負責分散式檔案儲存,任務排程,計算處理,本機我們在單機模式下把Hadoop執行起來

spark學習1——配置hadoop 單機模式並執行WordCount例項（ubuntu14.04 & hadoop 2.6.0）

相關推薦