Ubuntu14.04-Hadoop2.7.1-jdk1.7.0安裝偽分散式

阿新 • • 發佈：2018-12-22

任務1-1

1、建立hadoop使用者

sudo useradd -m hadoop 建立使用者

sudo passwd hadoop 設定密碼

2、安裝配置ssh

安裝ssh server：sudo apt-get install openssh-server

cd ~/.ssh/ # 若沒有該目錄，請先執行一次ssh localhost

ssh-keygen -t rsa # 會有提示，都按回車就可以

cat id_rsa.pub >> authorized_keys # 加入授權

使用ssh localhost試試能否直接登入

3、安裝配置JDK

cd /usr/lib/ 開啟/usr/lib資料夾

sudo mkdir jvm 建立jvm檔案

sudo tar zxvf ~/下載/jdk-8u91-linux-x64.tar.gz -C /usr/lib/jvm

設定JAVA_HOME：

sudo gedit ~/.bashrc

export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_91，儲存退出。

立即生效：source ~/.bashrc

測試JAVA_HOME是否設定成功，輸出了上面設定的路徑表示成功：

echo $JAVA_HOME

sudo apt-get install openjdk-7-jdk

export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64

java –version

安裝Hadoop2.7.1

sudo tar zxvf ~/下載/hadoop-2.7.1.tar.gz -C /usr/local

cd /usr/local/

sudo mv ./hadoop-2.7.1/ ./hadoop # 將資料夾名改為hadoop

sudo chown -R hadoop（當前使用者名稱） ./hadoop # 修改檔案許可權

sudo gedit ~/.bashrc

開啟介面後，在之前配置的JAVA_HOME後面輸入：

export HADOOP_INSTALL=/usr/local/hadoop

export PATH=$PATH:$HADOOP_INSTALL/bin

export PATH=$PATH:$HADOOP_INSTALL/sbin

export HADOOP_MAPRED_HOME=$HADOOP_INSTALL

export HADOOP_COMMON_HOME=$HADOOP_INSTALL

export HADOOP_HDFS_HOME=$HADOOP_INSTALL

export YARN_HOME=$HADOOP_INSTALL

立即生效：source ~/.bashrc

配置偽分散式

切換至配置檔案目錄： cd /usr/local/hadoop/etc/hadoop

sudo gedit core-site.xml

<name>hadoop.tmp.dir</name>

<value>file:/usr/local/hadoop/tmp</value>

<description>Abase for other temporary directories.</description>

</property>

<name>fs.defaultFS</name>

<value>hdfs://localhost:9000</value>

</property>

</configuration>

sudo gedit hdfs-site.xml

<name>dfs.replication</name>

</property>

<name>dfs.namenode.name.dir</name>

<value>file:/usr/local/hadoop/tmp/dfs/name</value>

</property>

<name>dfs.datanode.data.dir</name>

<value>file:/usr/local/hadoop/tmp/dfs/data</value>

</property>

</configuration>

sudo gedit yarn-site.xml

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

</configuration>

mv mapred-site.xml.template mapred-site.xml更換名字

sudo gedit mapred-site.xml

<name>mapreduce.framework.name</name>

</property>

</configuration>

啟動/停止hadoop

格式化。

hdfs namenode -format

start-all.sh 啟動所有的Hadoop守護程序。包括NameNode、Secondary NameNode、DataNode、JobTracker、 TaskTrack

stop-all.sh 停止所有的Hadoop守護程序。包括NameNode、Secondary NameNode、DataNode、JobTracker、 TaskTrack

start-dfs.sh 啟動Hadoop HDFS守護程序NameNode、SecondaryNameNode和DataNode

stop-dfs.sh 停止Hadoop HDFS守護程序NameNode、SecondaryNameNode和DataNode

hadoop-daemons.sh start namenode 單獨啟動NameNode守護程序

hadoop-daemons.sh stop namenode 單獨停止NameNode守護程序

hadoop-daemons.sh start datanode 單獨啟動DataNode守護程序

hadoop-daemons.sh stop datanode 單獨停止DataNode守護程序

hadoop-daemons.sh startsecondarynamenode單獨啟動SecondaryNameNode守護程序

hadoop-daemons.sh stop secondarynamenode 單獨停止SecondaryNameNode守護程序

start-mapred.sh 啟動Hadoop MapReduce守護程序JobTracker和TaskTracker

stop-mapred.sh 停止Hadoop MapReduce守護程序JobTracker和TaskTracker

hadoop-daemons.sh start jobtracker 單獨啟動JobTracker守護程序

hadoop-daemons.sh stop jobtracker 單獨停止JobTracker守護程序

hadoop-daemons.sh start tasktracker 單獨啟動TaskTracker守護程序

hadoop-daemons.sh stop tasktracker 單獨啟動TaskTracker守護程序

jps 檢視

完整程序如下：

2583 DataNode

2970 ResourceManager

3461 Jps

3177 NodeManager

2361 NameNode

2840 SecondaryNam

若執行jps後提示：

程式 'jps' 已包含在下列軟體包中：

* default-jdk

* ecj

* gcj-4.6-jdk

* openjdk-6-jdk

* gcj-4.5-jdk

* openjdk-7-jdk

請嘗試：sudo apt-get install <選定的軟體包>

那麼請執行下面命令，手動設定系統預設JDK：

Sudo update-alternatives --install /usr/bin/jps jps /usr/lib/jvm/jdk1.7.0_79/bin/jps 1

Sudo update-alternatives --install /usr/bin/javac javac /usr/lib/jvm/jdk1.7.0_79/bin/javac 300

sudo update-alternatives --install /usr/bin/java java /usr/lib/jvm/jdk1.7.0_79/bin/java 300

再次執行jps就不會出現提示了。

任務1-2

啟動Hadoop

hdfs dfs -mkdir -p /user/hadoop (要使用當前使用者的使用者名稱)

hdfs dfs -mkdir -p /input hdfs建立input目錄

hdfs dfs -put ~/下載/dat0102.dat /input/ 將本地檔案dat0102.dat匯入到HDFSinput目錄中

hadoop jar /usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-

examples-2.7.1.jar grep /input/dat0102.dat/ /output/ "HDFS"

呼叫Hadoop jar包來查詢dat0102.dat中的HDFS欄位出現的次數，並儲存在output目錄下

hdfs dfs -cat /output/part-r-00000 輸出hdfs欄位出現的次數

任務1-3

Hadoop 平臺進行效能調優

sudo gedit yarn-site.xml

<name>yarn.scheduler.maximum-allocation-mb</name>

</property>

sudo gedit mapred-site.xml

<name>mapreduce.map.memory.mb</name>

</property>

<name>mapreduce.reduce.memory.mb</name>

</property>

<name>mapreduce.map.java.opts</name>

</property>

<name>mapreduce.reduce.java.opts</name>

</property>

任務2-4

安裝hive2.1.1

sudo tar -zxvf ~/下載/apache-hive-2.1.1-bin.tar.gz -C /usr/local

cd /usr/local/

sudo mv apache-hive-2.1.1-bin hive # 將資料夾名改為hive

sudo chown -R hadoop:hadoop hive sudo chmod 774 hadoop # 修改檔案許可權

配置hive環境

sudo apt-get install vim 安裝vim

vim ~/.bashrc

export HIVE_HOME=/usr/local/hive

export PATH=$PATH:$HIVE_HOME/bin

source ~/.bashrc

配置Hive

cd /usr/local/hive/conf

mv hive-env.sh.template hive-env.sh

mv hive-default.xml.template hive-site.xml

mv hive-log4j2.properties.template hive-log4j2.properties

mv hive-exec-log4j2.properties.template hive-exec-log4j2.properties

修改hive-env.sh

export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_79 ##Java路徑

export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64 ##Java路徑

export HADOOP_HOME=/usr/local/hadoop ##Hadoop安裝路徑

export HIVE_HOME=/usr/local/hive ##Hive安裝路徑

export HIVE_CONF_DIR=/usr/local/hive/conf ##Hive配置檔案路徑

修改hive-site.xml

<?xml version="1.0" encoding="UTF-8" standalone="no"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<name>javax.jdo.option.ConnectionURL</name>

<value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true</value>

<description>JDBC connect string for a JDBC metastore</description>

</property>

<name>javax.jdo.option.ConnectionDriverName</name>

<value>com.mysql.jdbc.Driver</value>

<description>Driver class name for a JDBC metastore</description>

</property>

<name>javax.jdo.option.ConnectionUserName</name>

<description>username to use against metastore database</description>

</property>

<name>javax.jdo.option.ConnectionPassword</name>

<description>password to use against metastore database</description>

</property>

</configuration>

安裝並配置mysql

sudo apt-get install mysql-server #安裝mysql

service mysql start 啟動MySQL

service mysql stop 停止MySQL

sudo netstat -tap | grep mysql 檢視是否啟動成功

mysql -u root –p 進入MySQL shell 頁面

建立一個 hive 資料庫用來儲存 Hive 元資料，且資料庫訪問的使用者名稱和密碼都為 hive。

mysql> CREATE DATABASE hive;

mysql> USE hive;

mysql> CREATE USER 'hive'@'localhost' IDENTIFIED BY 'hive';

mysql> GRANT ALL ON hive.* TO 'hive'@'localhost' IDENTIFIED BY 'hive';

mysql> GRANT ALL ON hive.* TO 'hive'@'%' IDENTIFIED BY 'hive';

mysql> FLUSH PRIVILEGES;

mysql> quit;

安裝MySQL jdbc包

tar -zxvf ~/下載/mysql-connector-java-5.1.39.tar.gz –c /usr/local/hive解壓

cp /usr/local/hive/mysql-connector-java-5.1.40/mysql-connector-java-5.1.40 -bin.jar /usr/local/hive/lib #將mysql-connector-java-5.1.40-bin.jar拷貝到/usr/local/hive/lib目錄下

執行之前先初始化操作

schematool -initSchema -dbType mysql

啟動hadoop

start-all.sh

啟動hive

1、在Hadoop平臺建立result目錄

hdfs dfs -mkdir -p /result

2、建立Hive資料表（表名為：movie）

create table movie（name string,time string,score string）

row format delimited fields terminated by ',';

3、載入資料

load data local inpath 'home/hadoop/Downloads/dat0204.log' into table movie;

4、查詢資料

select * from movie where time>='2014.1.1' and time<='2014.12.31' order by time;

5、匯入Hadoop平臺的result目錄

insert overwrite directory "/result"

row format delimited fields terminated by ',' select * from movie;

6、jar包

hadoop jar /usr/local/Hadoop/share/Hadoop/tools/lib/hadoop-streaming-2.7.0.jar \

-file ~/Dowloads/ans0203map.py \

-mapper ‘python ans0203map.py’ \

-file ~/Dowloads/ans0203reduce.py \

-reducer ‘python ans0203reduce.py’ \

-input /input/dat0203.log \

-output /output

Ubuntu14.04-Hadoop2.7.1-jdk1.7.0安裝偽分散式

任務1-1 1、建立hadoop使用者 sudo useradd -m hadoop 建立使用者 sudo passwd hadoop 設定密碼 2、安裝配置ssh 安裝ssh server：sudo apt-get install openssh-serve

ubuntu 16.04搭建hadoop2.7.2(Vmware 12.0搭建完全分散式三臺虛擬機器)

此做法無實際意義，只是用來學習搭建過程和了解hadoop相關配置。版本：Ubuntu16.04 hadoop2.7.2（一臺電腦開三臺虛擬機器完全分散式）主結點：192.168.150.112 Caxiongyu1 從結點：192.168.150.113 Caix

ubuntu 安裝 pytorch （ubuntu16.04+pytorch0.4.1+python2.7+cuda8.0）

這裡使用pip安裝pytorch，我試過cuda安裝，和電腦的配置沒相容，沒有安裝成功，後來發現使用pip安裝很簡單方便，就是用pip安裝首先進入pytorch官網，往下拉會看到不同的安裝選項根據自

ubuntu 16.04 + Qt5.7.1+VTK6.3.0 + opencv2.4.13-viz（3D視覺化）安裝教程

ubuntu 16.04 + Qt5.7.1+VTK6.3.0 + opencv2.4.13-viz（3D視覺化）安裝教程 This section describes 3D visu

PHP 7.3.0, 7.2.13, 7.1.25, 7.0.33 和 5.6.39 釋出

PHP 開發團隊同時釋出了五個版本：7.3.0、7.2.13、7.1.25、7.0.33 和 5.6.39 。 PHP 7.3.0 Released PHP 7.0.33 Released PHP 7.1.25 Released PHP 7.2.13 Relea

XAMPP with PHP 7.3.0, 7.2.13, 7.1.25, 7.0.33 & 5.6.39 釋出

XAMPP 更新啦！官方為所有平臺釋出了支援最新 PHP 系列的 XAMPP 新版本，其中包括 PHP 7.3.0, 7.2.13, 7.1.25, 7.0.33 & 5.6.39。新版本的 PHP(7.3.0) 提供了許多改進和新功能，如 Flexible H

騰訊雲Centos6.6搭建javaweb環境:mysql5.1+jdk1.7+tomcat6完整過程

近日，入手了個騰訊雲伺服器，想著linux穩定，就選擇了linux centos6.6系統，最新的是7.1，但是聽說6.6比較穩定，就選擇了6.6，下面把步驟貼出來，希望對大家有所幫助。前期準備：安裝centos6.6系統在安裝系統時最好選用SSH

RK3288 android 7.1 預裝可解除安裝APK

RK3288 android 7.1 預裝可解除安裝APK 平臺需求實現後續平臺 RK3288 + Android 7.1 需求 ROM 中整合可解除安裝APK, 需滿足要求:

File Cabinet Pro for Mac(Mac選單欄檔案管理器) V6.7.1(2.7.9)破解版

File Cabinet Pro for Mac是Mac平臺上一款非常簡潔的Mac選單欄檔案管理器，File Cabinet Pro Mac破解版不僅僅是一個選單欄檔案管理軟體，它還內建了文字編輯器、pdf檢視器、影象檢視器和媒體播放器等小功能，功能非常的強大。 File Cabinet Pro

IntelliJ IDEA2018配置Hadoop2.7.2閱讀環境並執行偽分散式

1. 下載hadoop原始碼並編譯 $ sudo tar -zxvf hadoop-2.7.2-src.tar.gz 將解壓縮的原始碼包，複製到/usr/local目錄下： $ sudo cp -r

Ubuntu14 04升級vim7 4到8 0

1 vim8.0釋出1.1 vim8.0時代來臨終於釋出了Vim 8.0, 北京時間 2016年9月12日 22:12，Bram 更新了 8.0 的 Announcement：After more than ten years there is

Python3.7.1從原始碼編譯安裝

#!/bin/bash #確保shell 切換到當前shell 指令碼資料夾 current_file_path= ( c

與使用者互動與系統相關（7.1 ，7.2）

參考《瘋狂java講義》與使用者互動實際上，大部分程式都需要處理使用者動作，包括接受使用者的鍵盤輸入，滑鼠動作等。本章未涉及圖形使用者介面（GUI）程式設計，故本節主要介紹程式如何獲得使用者的鍵盤輸入。 1. 執行Java程式的引數回憶Java程式入口——main()方法的方法

PHP 5.6.40, 7.1.26, 7.3.1 & 7.2.14 釋出，安全修復版本

PHP 2019 新年第一波更新為幾個分支釋出了重要的安全修復版本，分別是 5.6.40, 7.1.26, 7.3.1 和 7.2.14。釋出公告頁面顯示，這幾個版本均包含重要的安全修復，以及其他的一些錯誤修復，官方建議升級至最新版本。此外，按官方的說法，PHP 5.

關於Linux-CentOS 7的jdk1.8的安裝

1.安裝之前先檢查一下系統有沒有自帶open-jdk 命令： rpm -qa |grep java rpm -qa |grep jdk rpm -qa |grep gcj 如果沒有輸入資訊表示沒有安裝。 2.如果安裝可以使用rpm -qa | grep java

elasticsearch-1.7.1 (es Windows 64) 安裝、啟動、停止的詳細記錄

elastic adj.有彈力的;可伸縮的;靈活的 restful adj.平靜的，悠閒的，讓人得到休息的;安生RESTful API 為了建立 Elasticsearch ，第一步是確保正確安裝Java 環境。我就預設安裝了，因為我確實安裝了，jdk 1.8版本的。這個

ubuntu16.04安裝偽分散式Hadoop2.9.1

1.前言最近需要搭建一個推薦系統，由於只有一臺伺服器，Hadoop使用偽分散式。 2.安裝偽分散式Hadoop 2.1.新增Hadoop使用者 sudo useradd -m hadoop -s /bin/bash 為hadoop設定密碼

CentOS 7.3 Zabbix-server4.0 安裝

pac fonts moni 軟件 restart 安裝過程參數 eap epo CentOS 7.3 Zabbix-server4.0 安裝安裝配置前先關閉 firewall 和SELINUX，避免安裝過程中報錯禁用SELINUX # sed -

《Windows核心安全與驅動開發》 7.1&7.2&7.3 串列埠的過濾

《Windows核心安全與驅動開發》閱讀筆記 -- 索引目錄《Windows核心安全與驅動開發》 7.1&7.2&7.3 串列埠的過濾一、裝置繫結的核心API 進行過濾的最主要的方法是對一個____進行繫結。我們可以首先認為：一個真實的裝置對應一個_____。通過程式設計可以生成一個

Ubuntu16.04環境下搭建Hadoop3.0.3偽分散式叢集

最近剛好趕上雙11騰訊促銷，於是搶購了一個8核16G記憶體的雲伺服器，加上業務上需要用到hadoop，hive，於是想搭建搭建一個hadoop分散式叢集，但是限於自己手頭上伺服器數量不多，因此打算先搭建一個hadoop偽分散式叢集。首先介紹一下我的安裝

Ubuntu14.04-Hadoop2.7.1-jdk1.7.0安裝偽分散式

相關推薦