【Hadoop 分布式部署五：分布式部署之分發、基本測試及監控】

阿新 • • 發佈：2018-09-30

conda -s 啟動上啟 res 點擊 mon web頁面 mapr

1.對 hadoop 進行格式化

　　　　到 /opt/app/hadoop-2.5.0 目錄下　　執行命令： bin/hdfs namenode -format

　　　　　　執行的效果圖如下 ( 下圖成功格式化不要沒事格式化 )

　　　　　　技術分享圖片

2.啟動dfs

　　　執行命令(在 /opt/app/hadoop-2.5.0/目錄下): sbin/start-dfs.sh

　　　　　　執行之後的效果就如下圖（可以看到 3個DataNode已經啟動起來了，NameNode 和 secondarynamenode 也已經啟動起來了）

　　　　　　技術分享圖片

　　　　　　然後在分別上這三臺機器上查看一下啟動情況

　　　　　　節點一（hadoop-senior.zuoayn.com）

　　　　　　技術分享圖片

　　　　　　節點二（hadoop-senior02.zuoyan.com）

　　　　　　技術分享圖片

　　　　　　節點三（Hadoop-senior03.zuoyan.com）

　　　　　　技術分享圖片

　　　　　　可以看到每個節點上執行的任務都是我們當時設計的，我的這種情況是比較幸運的沒有出現什麽錯誤，都啟動起來了，但是有的時候會出現

　　　　　　:Temporary failure in name resolutionop-senior02.zuoyan.com

　　　　　　:Temporary failure in name resolutionop-senior.zuoyan.com

　　　　　　出現這個原因是因為拷貝虛擬機出現的問題出現這種情況的原因就是域名解析問題機器重啟，還有另一種方式解決

　　　　　　就是到每個機器上單獨去啟動使用命令：sbin/hadoop-daemon.sh start datanode

通過瀏覽器打開查看一下啟動情況:

　　　　　　輸入網址：http://hadoop-senior.zuoyan.com:50070（這裏也就是第一個主機的ip地址，因為我映射到了windows的hosts中，所以也能通過這個主機名訪問）

　　　　　　　點擊主頁的 LiveNodes 就可以看見如下的界面

　　　　　　　這個界面上顯示的就是我們的節點

　　　　　　　　　　　　技術分享圖片

使用一些命令進行測試一下

　　　　　　　　創建目錄命令: bin/hdfs dfs -mkdir -p /user/beifeng/tmp/conf

　　　　　　　　技術分享圖片

　　　　　　　　上傳文件命令: bin/hdfs dfs -put /etc/hadoop/*.-site.xml /user/beifeng/tmp/conf

　　　　　　　　技術分享圖片

讀取文件命令: bin/hdfs dfs -text /user/beifeng/tmp/conf/core-site.xml (下圖就是成功的讀取出來了)

　　　　　　　　技術分享圖片

3.啟動yarn

　　　　(在/opt/app/hadoop-2.5.0 的目錄下 ) 使用命令: sbin/start-yarn.sh

　　　　技術分享圖片

　　　　在啟動yarn的時候我的出先了一個問題就是resourcemanager 啟動不起來不論是在第一個節點上看，還是在第二個節點上看都沒有resourcemanager

　　　　　技術分享圖片

　　　　　　日誌信息如下

　　　　　　技術分享圖片

　　　　　　　最終在開源中國上查找到了解決方案

　　　　　　　　Namenode和ResourceManger如果不是同一臺機器，不能在NameNode上啟動 yarn，應該在ResouceManager所在的機器上啟動yarn。

4.測試Mapreduce程序

　　　　　　　　首先創建一個目錄用來存放輸入數據命令: bin/hdfs dfs -mkdir -p /user/beifeng/mapreduce/wordcount/input

　　　　　　　　技術分享圖片

　　　　　　　　上傳文件到文件系統上去命令：bin/hdfs dfs -put /opt/modules/hadoop-2.5.0/wc.input /user/beifeng/mapreduce/wordcount/input

　　　　　　　　　技術分享圖片

　　　　　　　　使用命令查看一下文件是否上傳成功命令:bin/hdfs dfs -ls /user/beifeng/mapreduce/wordcount/input (可以看到wc.input 已經在這個目錄下)

　　　　　　　　　　技術分享圖片

　　　　　　　　完成準備工作之後就開始使用 yarn 來運行wordcount 程序

　　　　　　　　命令: bin/yarn jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar wordcount /user/beifeng/mapreduce/wordcount/input /user/beifeng/mapreduce/wordcount/output

　　　　　　　　程序已經開始在機器上運行了

　　　　　　　　技術分享圖片

　　　　　　　　從WEB頁面上看到的效果

　　　　　　　　技術分享圖片

　　　　　　　　最後在使用hdfs 的命令來查看一下 wordcount 統計的結果命令：bin/hdfs -dfs -text /user/beifeng/mapreduce/wordcount/output/part*

　　　　　　　　技術分享圖片

到此配置結束，但是剩下的還有環境問題解決和集群基礎測試

【Hadoop 分布式部署五：分布式部署之分發、基本測試及監控】

conda -s 啟動上啟 res 點擊 mon web頁面 mapr 1.對 hadoop 進行格式化　　　　到 /opt/app/hadoop-2.5.0 目錄下　　執行命令： bin/hdfs namenode -format 　　　　　　執行的效果圖

【Hadoop 分布式部署五：分布式部署之分發、基本測試及監控】

【Hadoop 分布式部署五：分布式部署之分發、基本測試及監控】

CentOS7下的Django2整合部署五：Jenkins的流水線部署pipeline-job

【Hadoop 分布式部署八：分布式協作框架Zookeeper架構功能講解及本地模式安裝部署和命令使用】

【Hadoop 分布式部署九：分布式協作框架Zookeeper架構分布式安裝部署】

EF6學習筆記二十五：分布式事務

搞懂分布式技術1：分布式系統的一些基本概念

搞懂分布式技術2：分布式一致性協議與Paxos，Raft算法

搞懂分布式技術12：分布式ID生成方案

分針網——每日分享：網頁布局時CSS無效的常見原因

分散式學習筆記五：redis分步式鎖

分散式學習之五：redis分步式鎖

Django學習筆記五：通過nginx+uwsgi部署Django專案(暫時靜態檔案沒有部署上去)

python接口自動化測試二十五：執行所有用例，並生成HTML測試報告

重磅發布 | 黑鏡調查：深淵背後的真相之「DDoS 威脅與黑灰產業調查報告」

jvm探祕五：Class類檔案結構之屬性表

SpringBoot系列五：SpringBoot錯誤處理（資料驗證、處理錯誤頁、全域性異常）

python基礎五：元組的index，del，count方法及字典的修改、增加、刪除（del、clear）、遍歷（keys、values、items）

Postman系列五：Postman中電商網站cookie、token檢驗與引數傳遞實戰

Shell腳本基礎、使用變量、條件測試及選擇、列表式循環

【linux之進程管理，系統監控】

【Hadoop 分布式部署 五：分布式部署之分發、基本測試及監控】

相關推薦

【Hadoop 分布式部署五：分布式部署之分發、基本測試及監控】