export JAVA_HOME=/usr/lib/jdk/jdk1.8
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH

export HADOOP_HOME=/usr/local/hadoop
export HADOOP_MAPRED_HOME=$HADOOP_HOME 
export HADOOP_COMMON_HOME=$HADOOP_HOME 
export HADOOP_HDFS_HOME=$HADOOP_HOME 
export YARN_HOME=$HADOOP_HOME
export CLASSPATH=$($HADOOP_HOME/bin/hadoop classpath):$CLASSPATH
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib"
export JAVA_LIBRARY_PATH=$HADOOP_HOME/lib/native:$JAVA_LIBRARY_PATH

2.3 讓配置立即生效

$ source ~/.bashrc

3. 修改Hadoop配置檔案

在hadoop目錄下有etc資料夾,etc裡有hadoop子資料夾,這個裡面放的是hadoop的配置檔案

3.1 修改hadoop-env.sh

將原來的export JAVA_HOME=${JAVA_HOME},改成自己本機的jdk路徑
這裡寫圖片描述

3.2 修改core-site.xml

新增如下配置

<configuration>
    <property>
		<name>fs.defaultFS</name>
		<value>hdfs://localhost:9000</value>
    </property>
</configuration>

3.3 修改yarn-site.xml

新增如下配置

<configuration>

<!-- Site specific YARN configuration properties -->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
		<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
		<value>org.apache.hadoop.mapred.ShuffleHandler</value>
    </property>
</configuration>

3.4 修改mapred-site.xml

之前只有mapred-site.xml.template這個檔案,複製一個這個,並重命名為mapred-site.xml,新增如下配置

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

4. 建立並格式化HDFS目錄

4.1 在hadoop下新建hadoop_data/hdfs資料夾,在hdfs下新建namenode和datanode資料夾

$ sudo mkdir -p /usr/local/hadoop/hadoop_data/hdfs/namenode
$ sudo mkdir -p /usr/local/hadoop/hadoop_data/hdfs/datanode

4.2 將hadoop目錄的所有者改為當前使用者(winter)

$ sudo chown winter:winter -R /usr/local/hadoop

4.3 在hdfs-site.xml新增配置

<configuration>
    <property>
		<name>dfs.replication</name>
		<value>3</value>
    </property>
    <property>
		<name>dfs.namenode.name.dir</name>
		<value>file:/usr/local/hadoop/hadoop_data/hdfs/namenode</value>
    </property>
    <property>
		<name>dfs.datanode.data.dir</name>
		<value>file:/usr/local/hadoop/hadoop_data/hdfs/datanode</value>
    </property>
</configuration>

4.4 將HDFS格式化

$ hadoop namenode -format

5. 啟動Hadoop

#啟動HDFS
$ start-dfs.sh

#啟動MapReduce框架 YARN
$ start-yarn.sh

輸入jps命令檢視已經啟動的程序
這裡寫圖片描述

http://localhost:8088
這裡寫圖片描述

http://localhost:50070
這裡寫圖片描述

Spark學習筆記(二) 安裝Hadoop單節點叢集

安裝Hadoop單節點叢集 1. 下載並解壓Hadoop 1.1 下載Hadoop 1.2 解壓Hadoop包 1.3 將解壓的資料夾重新命名為Hadoop,然後拷貝到/usr/local下 2. 設定Hadoop環境變數

[Spark]學習筆記二——RDDs

一、一些物件 1.Driver Program：包含程式的main()方法，RDDs的定義和操作，它管理很多節點，我們稱之為executors 2.SparkContext：Driver Program通過SparkContext物件訪問Spark，SparkContext物件代表和一個

Hadoop學習筆記(三) 安裝Hadoop分散式叢集

執行環境因為是為了學習,且只有一臺PC,只能在虛擬機器裡安裝Hadoop 軟體配置版本主機 Win7,記憶體8G 虛擬機器 VMware 14 Linux ubuntu-14.04.5-desktop (使用ubuntu-18或1

Android學習筆記二安裝環境

update(2012.11.30) : 今天在Windows下裝個環境，Google推出 adt-bundle已經將ADT、SDK整合到Eclipse中，屬於一鍵安裝，無需自己再配置了，可以直接進入第4步驟。在Linux環境也相似，第2-3步可以合併，估計仍需要安裝java SDK。總之工具是越來越方便了。

蝸龍徒行-Spark學習筆記【五】IDEA中叢集執行模式的配置

問題現象在IDEA中執行sparkPI，報錯： Exception in thread “main” org.apache.spark.SparkException: A master URL must be set in your configurati

Hadoop學習筆記(二)----環境搭建之CentOS 7 配置與安裝Hadoop

# Load additional iptables modules (nat helpers) # Default: -none- # Space separated list of nat helpers (e.g. 'ip_nat_ftp ip_nat_irc'), which # are load

Hadoop學習筆記（二）設定單節點叢集

本文描述如何設定一個單一節點的 Hadoop安裝，以便您可以快速執行簡單的操作，使用HadoopMapReduce和Hadoop分散式檔案系統(HDFS)。Hadoop版本：Apache Hadoop 2.5.1系統版本：CentOS 6.5，核心（uname -r）：2.6

Java基礎學習筆記二十四 MySQL安裝圖解

password data 默認 count 重新 doc documents tran xp系統、MYSQL的安裝１、打開下載的mysql安裝文件mysql-5.5.27-win32.zip，雙擊解壓縮，運行“setup.exe”。

（學習筆記版）Hadoop入門（一）：Hadoop2.7.3完全分布式集群安裝

min property per cal mon 分別是 master 修改 node 在這裏寫下安裝hadoop2.7.3版本的完全分布式的過程，因為剛開始學習hadoop不久，希望自己把學習的東西記錄下來，和大家一起分享，可能有錯誤的地方，還請大牛們批評指正，在我學習的

Docker學習筆記二：Docker的安裝

ros -h bionic docker customer tex 鏈接 space 版本安裝環境：操作系統：Ubuntu 18.04 LTS，code name:bionic (#lsb_release -a)內核版本：4.15.0-29-generic(#uname

一、hadoop單節點安裝測試

一、hadoop簡介相信你或多或少都聽過hadoop這個名字，hadoop是一個開源的、分散式軟體平臺。它主要解決了分散式儲存（hdfs）和分散式計算(mapReduce)兩個大資料的痛點問題，在hadoop平臺上你可以輕易地使用和擴充套件數千臺的計算機而不用關心底層的實現問題。而現在的hadoop更是形

Spark學習筆記（18）—— Elasticsearch 安裝

1 解壓 [[email protected] ~]$ ll total 42708 drwxrwxr-x. 9 hadoop hadoop 180 Oct 24 21:33 apps -rw-r--r--. 1 hadoop hadoop 27540442 Ju

Spark學習筆記(三) Ubuntu搭建Hadoop分散式叢集

Ubuntu搭建Hadoop分散式叢集執行環境配置目標搭建Hadoop分散式叢集步驟 1 搭建master 1.1 安裝JDK 1.2 安裝SSH 1.3 安裝Hadoop 2

Spark學習筆記(四) Ubuntu安裝Scala

1. 下載並解壓Scala 1.1 下載Scala2.11.8 下載地址: https://www.scala-lang.org/download/2.11.8.html 選擇Unix版本的下載 1.2 解壓Scala包 $ sudo tar xvf scala-2.11.

Spark學習筆記(一) Ubuntu安裝JDK和ssh

1. Hadoop的必要軟體環境 Java開發環境JDK ssh(安全外殼協議) 1.1 Ubuntu下安裝JDK 系統環境:ubuntu-18.04.1 JDK版本:1.8 1.1.1 從oracle官方下載jdk的包到本機

Bootstrap學習筆記(二) 表單

3-1 基礎表單　　單中常見的元素主要包括：文字輸入框、下拉選擇框、單選按鈕、複選按鈕、文字域和按鈕等。　　在Bootstrap框架中，通過定製了一個類名`form-control`，也就是說，如果這幾個元素使用了類名“form-control”，將會實現一些設計上的定製效果。　　

K8S運維筆記-單節點叢集安裝(1.11版本)

使用kubeadm安裝K8S 安裝kubeadm 更新安裝源 cat <<EOF > /etc/yum.repos.d/kubernetes.repo [kubernetes] nam

hadoop學習筆記二

tab sap stack files ring word text 模式 sha hadoop2.x學習筆記 df -hl 查看磁盤剩余空間 hdfs 數據默認存儲路徑 data/tmp/dfs data/ └── tmp ├── dfs │ ├──

Spark學習筆記（1）—— Spark 介紹，叢集安裝

1 Spark 介紹 Spark是一種快速、通用、可擴充套件的大資料分析引擎，2009年誕生於加州大學伯克利分校AMPLab，2010年開源，2013年6月成為Apache孵化專案，2014年2月成為Apache頂級專案。目前，Spark生態系統已經發展成為一個

centos7 hadoop 3節點叢集安裝筆記

安裝 hadoop 賦予hadoop使用者sudo許可權： 1. 切換到root使用者，給hadoop使用者授予sudo許可權：修改/etc/sudoers檔案，由於預設root使用者也不可以寫

Spark學習筆記(二) 安裝Hadoop單節點叢集

安裝Hadoop單節點叢集

1. 下載並解壓Hadoop

1.1 下載Hadoop

1.2 解壓Hadoop包

1.3 將解壓的資料夾重新命名為Hadoop,然後拷貝到/usr/local下

2. 設定Hadoop環境變數

2.1 開啟.bashrc檔案

2.2 在檔案裡後面新增如下配置