阿里雲搭建hadoop叢集伺服器，內網、外網訪問問題（詳解。。。）

阿新 • • 發佈：2018-12-06

　　這個問題花費了我將近兩天的時間，經過多次是錯和嘗試，現在想分享給大家來解決此問題避免大家入坑，以前都是在區域網上搭建的hadoop叢集，並且是區域網訪問的，沒遇見此問題。

因為阿里雲上搭建的hadoop叢集，需要配置對映叢集經過內網訪問，也就是區域網的ip地址。

　　如果配置為公網IP地址，就會出現叢集啟動不了，namenode和secondarynamenode啟動不了，如果將主機的對映檔案配置為內網IP叢集就可以正常啟動了。但通過eclipse開發工具訪問

會出錯，顯示了阿里雲內網的ip地址來訪問datanode，這肯定訪問不了啊，這問題真實醉了，就這樣想了找了好久一致沒有思路。

　　最終發現需要在hdfs-site.xml中修改配置項dfs.client.use.datanode.hostname設定為true，就是說客戶端訪問datanode的時候是通過主機域名訪問，就不會出現通過內網IP來訪問了

最初檢視日誌發現：

一、檢視日誌

1. less hadoop-hadoop-namenode-master.log

2.less hadoop-hadoop-secondarynamenode-master.log

二、解決叢集訪問問題

1.檢視hosts對映檔案

上面是公網IP需要替換為內網IP

然後正常搭建hadoop叢集

2.core-site.xml

<!-- 指定HADOOP所使用的檔案系統schema（URI），HDFS的老大（NameNode）的地址 -->
<property>
    <name>fs.defaultFS</name>
    <value>hdfs://master:9000</value>
</property>
<!-- 指定hadoop執行時產生檔案的儲存目錄 -->
<property>
    <name>hadoop.tmp.dir</ 
name>
    <value>/home/hadoop/BigData/hadoop-2.7.3/data</value>
</property>

3.hadoop-env.sh 修改export JAVA_HOME值

export JAVA_HOME=/home/hadoop/BigData/jdk1.8

4.hdfs-site.xml 注意：新增一個dfs.client.use.datanode.hostname配置

<!-- 指定namenode的http通訊地址 -->
<property>
    <name>dfs.namenode.secondary.http-address</name>
    <value>master:50090</value>
</property>
<!-- 指定HDFS副本的數量 -->
<property>
    <name>dfs.replication</name>
    <value>1</value>
</property>
<property>
    <name>dfs.permissions</name>
    <value>false</value>
</property>
<!-- 如果是通過公網IP訪問阿里雲上內網搭建的叢集 -->
<property>
    <name>dfs.client.use.datanode.hostname</name>
    <value>true</value>
    <description>only cofig in clients</description>
</property>

5.mapred-site.xml

<!-- 指定mr執行在yarn上 -->
<property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
</property>
<!-- jobhistory的address -->
<property>
    <name>mapreduce.jobhistory.address</name>
    <value>master:10020</value>
</property>
<!-- jobhistory的webapp.address -->
<property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>master:19888</value>
</property>

6. yarn-site.xml

<!-- 指定YARN的老大（ResourceManager）的地址 -->
<property>
    <name>yarn.resourcemanager.hostname</name>
    <value>master</value>
</property>
<!-- reducer獲取資料的方式 -->
<property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
</property>

7.hadoop namenode -format格式化，然後啟動start-all.sh

8.在本地IDE環境中編寫單詞統計測試叢集訪問

public class WordCount {
    public static class TokenizerMapper extends Mapper<LongWritable, Text, Text, IntWritable>{
        private final static IntWritable one = new IntWritable(1);
        private Text word = new Text();
        @Override
        protected void map(LongWritable key, Text value, Mapper<LongWritable, Text, Text, IntWritable>.Context context)
                throws IOException, InterruptedException {
            StringTokenizer itr = new StringTokenizer(value.toString());
            while(itr.hasMoreTokens()) {
                word.set(itr.nextToken());
                context.write(word, one);
            }
        }
        
        public static class WordCountReducer extends Reducer<Text, IntWritable, Text,IntWritable>{
            private IntWritable result = new IntWritable();
            @Override
            protected void reduce(Text key, Iterable<IntWritable> values,
                    Reducer<Text, IntWritable, Text, IntWritable>.Context context)
                    throws IOException, InterruptedException {
                    int sum = 0;
                    for(IntWritable item:values) {
                        sum += item.get();
                    }
                    result.set(sum);
                    context.write(key, result);
            }
        }
        public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
            Configuration conf = new Configuration();
            String[] otherArgs = new GenericOptionsParser(conf, args).getRemainingArgs();
            if(otherArgs.length < 2) {
                System.err.println("Usage: wordcount <in> [<in>....] <out>");
                System.exit(2);
            }
            Job job = Job.getInstance(conf, "word count");
            job.setJarByClass(WordCount.class);
            job.setMapperClass(TokenizerMapper.class);
            job.setCombinerClass(WordCountReducer.class);
            job.setReducerClass(WordCountReducer.class);
            job.setOutputKeyClass(Text.class);
            job.setOutputValueClass(IntWritable.class);
            for(int i = 0; i < otherArgs.length -1; i++) {
                FileInputFormat.addInputPath(job, new Path(otherArgs[i]));
            }
            FileSystem fs = FileSystem.get(conf);
            Path output = new Path(otherArgs[otherArgs.length - 1]);
            if(fs.exists(output)) {
                fs.delete(output, true);
                System.out.println("output directory existed! deleted!");
            }
            FileOutputFormat.setOutputPath(job, output);
            System.exit(job.waitForCompletion(true) ? 0 : 1);
        }
    }
}

9.執行的時候配置一個數據的存放路徑和資料的輸出路徑位置

10 . 正常執行並訪問了阿里雲的hadoop叢集

阿里雲搭建hadoop叢集伺服器，內網、外網訪問問題（詳解。。。）

　　這個問題花費了我將近兩天的時間，經過多次是錯和嘗試，現在想分享給大家來解決此問題避免大家入坑，以前都是在區域網上搭建的hadoop叢集，並且是區域網訪問的，沒遇見此問題。因為阿里雲上搭建的hadoop叢集，需要配置對映叢集經過內網訪問，也就是區域網的ip地址。　　如果配置為公網IP地址，就會出現叢

使用阿里雲搭建自己的伺服器，並部署IIS為自己的app提供服務

之前幫實驗室搭過一個阿里雲，最近看到阿里雲有學生優惠，就自己買了個伺服器，搭了個同樣的伺服器供自己折騰，主要做測試服。下面記錄下搭建過程中遇到的問題。買伺服器什麼就不說了，去阿里雲註冊個帳號，然後像淘寶一樣購物就好了。買完之後可以拿到自己伺服器的公網IP

CentOS搭建SVN伺服器，並通過Apache HTTP方式訪問（轉載至上品物語）

摘要：本文主要講述了在centos 6.5環境下搭建svn伺服器，可通過svn:\\IP方式訪問。同時由於部分公司內網埠限制，並不能訪問外網的svn伺服器，所以特地結合了apache伺服器，使得可以通過http方式http://IP方式訪問svn伺服器。環境準備：

利用阿里雲搭建私有Git伺服器

伺服器系統：Centos 6 （檢視centos版本命令：lsb_release -a）客戶端系統：Windows 7 一、伺服器端安裝Git ==通常centos上使用yum源安裝的git版本過低== 1. 檢查系統上是否已經安裝git，若已有則解除安裝 // 檢視當前git版本 #

Ubuntu 搭建hadoop叢集成功，但MobaXterm無法遠端連線叢集各個節點

由於我是在VMware上使用的ubuntu系統，因此解決這個問題需要先了解一下VMware三種網路工作模式：我們可以看到有VMnet0（橋接模式）、VMnet1（僅主機模式）、VMnet8（NAT模式）其中： VMnet0表示的是：用於橋接模式下的虛擬交換機；

用阿里雲搭建Http代理伺服器

先說下我的執行環境: Ubuntu16.04+python3.5，用的是阿里雲ECS乞丐版。搭建步驟: 0. 直接用xshell或putty遠端到雲伺服器 1. pip3 install

使用阿里雲搭建Ubantu VPN伺服器 ----千雅爸爸

1：在阿里雲上面購買一臺新加坡的伺服器，也可以是美國的; 注意可以選擇按流量或者是按包月來付費的 2：記住一定要選擇“經典網路” 3: 建立安全組(現在好像不需要建立安全組了) 4:選擇Ubantu的系統，輸入root密碼 5：購買成功後，可以得到一個公網i

搭建tomcat伺服器，目標可通過外網ip訪問本機

最近學習了一些微信的開發者方面的東西，申請了一個阿里雲，因為一些原因，不能在阿里雲直接佈置伺服器，只能通過遠端控制主機來佈置，雖然我也不明白為什麼我一個前端要去弄那些，但是也算收穫一些東西了。記錄一下。以下主要內容有： 1 . 如何把tomcat從localhost

阿里雲oss圖片儲存服務通過nginx轉發至外網

公司採用了阿里雲的oss來儲存大量圖片，oss儲存很方便，儲存的圖片可直接通過url地址訪問，但是也有個問題，外網訪問oss檔案需要通過流量計費，而內網訪問不計流量費用。原本我們就有阿里雲伺服器，既然如此是否可通過在阿里雲伺服器上的nginx進行轉發，這樣就可達

內網、外網、公網

內網和外網其實是不書面的說法，只是一種通俗的說法，比方法一個公司的區域網就可以稱為內網，而INTERNET就是外網了；公網和私網是相對應的，比方說私網地址和公網地址，私網地址三個網段 192．168．0．0---192。168。255。255 10．0．0．0---10。255。255。255

原來資料庫中的模糊查詢，分組，聯合查詢是這麼使用的（詳解）

1 模糊查詢 like關鍵字萬用字元 % 任意長度的任意字串 _ 代表任意一個字元 [1-6] 代表1到6之間的一個字元 [^0-5] 代表不是0到5之間的一個字元 between 值1 and 值2 select * from 表名 where 列

淺談網路地址轉換(NAT)技術與內網、外網

前言　我們現在常使用的IP地址是IPv4地址，由四組0-255的十進位制數字組成，中間以小數點分隔。Internet上的每一臺主機或者路由器都至少有一個IP地址。IP地址(IPv4地址，下文IP地址預設指IPv4)的長度是32位，總數為2的32次方，大約43億個。　

利用DNSPod實現動態域名解析DDNS (解析內網、外網或IPV6地址)

DDNS是什麼對於DHCP方式獲得的IP，無論對於區域網內來說，還是外網來說，都會有使得IP地址每隔一段時間變化一次，如果想要通過恆定不變的地址訪問主機，就需要動態域名解析。用一句話說明原理是：把動態變化的IP地址繫結到固定不變的域名上，這樣便是以不變應萬變，只要記住域名

阿里雲ECS上搭建Hadoop叢集環境——使用兩臺ECS伺服器搭建“Cluster mode”的Hadoop叢集環境

Ingredient：之前在：這4篇文章裡講述了搭建Hadoop環境時在本地“/etc/hosts”裡面的ip域名配置上應該注意的事情，以及如何配置伺服器之間的ssh免密碼登入，啟動Hadoop遇到的一些問題的解決等等，這些都是使用ECS伺服器搭

一臺阿里雲2臺騰訊雲伺服器搭建Hadoop叢集

1.準備工作：jdk安裝（個人選擇的1.8版本） 2.ssh免密登陸：關閉放火牆（可以將要開放的埠加入防火牆的開發埠中，學習用就直接關閉防火牆了）： 1）關閉firewall： systemctl stop firewalld.service #停

雲伺服器搭建Hadoop叢集

使用兩個阿里雲和一個騰訊雲搭建Hadoop叢集方法和 hadoop分散式叢集搭建一樣但是同樣的步驟會出現下面的錯誤 NameNode和ResourceManager、SecondrryNameNode三個程序都沒有開啟主要原因是hosts中三個IP網段不一

阿里雲搭建SS代理。內附2018阿里雲伺服器2折優惠碼

Shadowsocks的執行原理與其他代理工具基本相同，使用特定的中轉伺服器完成資料傳輸。在伺服器端部署完成後，使用者需要按照指定的密碼、加密方式和埠使用客戶端軟體與其連線。在成功連線到伺服器後，客戶端會在使用者的電腦上構建一個本地Socks5代理。瀏覽網路時，

hadoop：搭建Hadoop叢集，一個月6T的數量需要幾臺伺服器

配置幾個namenode,幾個datanode,namenode和datanode怎麼部署，記憶體與硬碟大小？？最好是兩個做成HA 關於硬碟: 6T的資料容量,看你副本數量設定是多少,一般預設為3,那麼僅這些就需要18T硬碟,稍微大一點20T吧;這

阿里雲輕量應用伺服器debian8.9用apache多埠搭建多站點

前幾天想要再搭個網站玩玩，就用阿里的伺服器，apache本地搭建站點和伺服器相差不多，然而卻踩了大坑，差點耗死在這兒。先進入apache這個目錄，有如下資料夾：開啟ports.conf, 新增 Listen 埠。然後進入，sites-available 裡邊，將000-defau

本地搭建hadoop叢集-各種報錯，不斷更新

20180716： Unable to obtain hostName java.net.UnknownHostException: hadoop100: hadoop100 解決方案： vi /etc/hosts 檢視叢集對應ip 名稱 192.168.77.100 mas

阿里雲搭建hadoop叢集伺服器，內網、外網訪問問題（詳解。。。）

一、檢視日誌

1. less hadoop-hadoop-namenode-master.log

2.less hadoop-hadoop-secondarynamenode-master.log

二、解決叢集訪問問題

1.檢視hosts對映檔案

2.core-site.xml

3.hadoop-env.sh 修改export JAVA_HOME值

4.hdfs-site.xml 注意：新增一個dfs.client.use.datanode.hostname配置

5.mapred-site.xml

6. yarn-site.xml

7.hadoop namenode -format格式化，然後啟動start-all.sh

8.在本地IDE環境中編寫單詞統計測試叢集訪問

9.執行的時候配置一個數據的存放路徑和資料的輸出路徑位置

10 . 正常執行並訪問了阿里雲的hadoop叢集

相關推薦