【轉】Windows10下Eclipse搭建Hadoop3開發環境

阿新 • • 發佈：2019-01-10

Windows10下Eclipse搭建Hadoop3開發環境

前言

由於筆記本配置限制，虛擬機器CentOs-7關閉了圖形介面，作者在Windows端編寫mapreduce程式然後在linux上執行。

工具

windows 10
CentOs-7（已安裝，見上一博文）
eclipse-jee-oxygen-2-win32-x86_64.zip（採用其他精簡版的eclipse可能會出問題）
jdk1.8（請保證jdk位數跟計算機位數一致）

在Windows上解壓Hadoop3

我們程式設計要用到hadoop的庫，需要將hadoop-3.0.0.tar.gz

（最好跟linux上hadoop版本一致）解壓一下，然後前往https://download.csdn.net/download/junior19/10292556下載這個東西，覆蓋掉hadoop-3.0.0\bin資料夾；接著將bin裡面的hadoop.dll複製到C:\Windows\System32中。（hadoop.dll檔案儘量用最新版的）
到系統->高階系統設定->環境變數下面的系統變數處選擇“新建”

然後設定一下PATH

開放Hadoop的許可權

為了能在Ecplise上對Linux的HDFS檔案操作，需要設定一下許可權。
進入Linux修改裡面的hdfs-site.xml

，新增下面程式碼

<property>
   <name>dfs.permissions</name>
   <value>false</value>
</property>

請保證已經在hadoop上已經建立了使用者以及新建了input資料夾，如果之前沒做這一步請執行以下命令（開啟Hadoop集群后）

hadoop dfs -mkdir -p /user/hadoop
hadoop dfs -mkdir input

（開啟Hadoop集群后）執行hadoop fs -chmod 777 /user/hadoop

在Eclipse上安裝Hadoop外掛

自行去下載hadoop-eclipse-plugin-2.6.0.jar，放到Eclipse的plugins目錄下，重啟Eclipse。
開啟eclipse，在window->Preferences->Hadoop Map/Reduce下設定Hadoop的解壓路徑
點選window->show view->other->map/reduce locations OPEN。
也可以在右上角的這裡切換到map/reduce專案（以後可以在這裡切回去Resource介面）
右鍵new一個
配置如下，Host那裡最好直接填IP地址，如果像我這樣填Linux主機名請先在Windows的Hosts檔案設定好IP對映
然後點選右邊設定一下hadoop.tmp.dir的地址，跟core-site.xml的要一致
還有這個我們之前設定為1
Finish後可能會報NullPointer錯誤，貌似沒影響先不理它。

執行WordCount例子

先去linux啟動下Hadoop叢集start-all.sh
此時Eclipse應該能看到以下內容，沒有就試試右鍵重新整理下
注意要先建立一些檔案到input資料夾內，建立方法可以在linux上用命令列上傳上去，也可以先在windows新建好一些形如input1.txt檔案，裡面隨便填一些句子hello word之類的，然後在Eclipse直接上傳上去。
新建專案，File->new->Project->Map/Reduce project ，包名最好留空！否則最後執行老會遇到”找不到class”錯誤。
新建一個class命名為WordCount加入下面程式碼

import java.io.IOException;
import java.util.Iterator;
import java.util.StringTokenizer;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;
public class WordCount {
    public WordCount() {
    }
     public static void main(String[] args) throws Exception {
        Configuration conf = new Configuration();
        String[] otherArgs = (new GenericOptionsParser(conf, args)).getRemainingArgs();
        if(otherArgs.length < 2) {
            System.err.println("Usage: wordcount <in> [<in>...] <out>");
            System.exit(2);
        }
        Job job = Job.getInstance(conf, "word count");
        job.setJarByClass(WordCount.class);
        job.setMapperClass(WordCount.TokenizerMapper.class);
        job.setCombinerClass(WordCount.IntSumReducer.class);
        job.setReducerClass(WordCount.IntSumReducer.class);
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(IntWritable.class); 
        for(int i = 0; i < otherArgs.length - 1; ++i) {
            FileInputFormat.addInputPath(job, new Path(otherArgs[i]));
        }
        FileOutputFormat.setOutputPath(job, new Path(otherArgs[otherArgs.length - 1]));
        System.exit(job.waitForCompletion(true)?0:1);
    }
    public static class TokenizerMapper extends Mapper<Object, Text, Text, IntWritable> {
        private static final IntWritable one = new IntWritable(1);
        private Text word = new Text();
        public TokenizerMapper() {
        }
        public void map(Object key, Text value, Mapper<Object, Text, Text, IntWritable>.Context context) throws IOException, InterruptedException {
            StringTokenizer itr = new StringTokenizer(value.toString()); 
            while(itr.hasMoreTokens()) {
                this.word.set(itr.nextToken());
                context.write(this.word, one);
            }
        }
    }
public static class IntSumReducer extends Reducer<Text, IntWritable, Text, IntWritable> {
        private IntWritable result = new IntWritable();
        public IntSumReducer() {
        }
        public void reduce(Text key, Iterable<IntWritable> values, Reducer<Text, IntWritable, Text, IntWritable>.Context context) throws IOException, InterruptedException {
            int sum = 0;
            IntWritable val;
            for(Iterator i$ = values<span class="hljs-preprocessor">.iterator</span>()<span class="hljs-comment">; i$.hasNext(); sum += val.get()) {
                val = (IntWritable)i$.next();
            }
            this.result.set(sum);
            context.write(key, this.result);
        }
    }
}

右鍵class選擇run as->Run configuations設定如下，當然裡面的IP填你Linux主機的IP，然後RUN即可。
輸出結果如下，下次執行的話需要先將output資料夾刪除掉。

打包JAR在linux執行

如果上述步驟搞不好，無法在eclipse直接執行程式碼，也可以export出一個jar包，通過SFTP發到linux上執行

hadoop jar WordCount.jar WordCount input output

這裡中間的WordCount貌似是填Main函式的所在Class名，但是網上說填包名，我報錯無數次（找不到class）之後，在新建project時不用包名才成功執行。

【轉】Windows10下Eclipse搭建Hadoop3開發環境

Windows10下Eclipse搭建Hadoop3開發環境前言由於筆記本配置限制，虛擬機器CentOs-7關閉了圖形介面，作者在Windows端編寫mapreduce程式然後在linux上執行。

【ReactJS】一、手把手搭建ReactJS開發環境（Sublime）

React的介紹我就不多說了，總之最近很火。最近打算學一下react(其實是預謀已久)，所以對於我這個高度強迫症患者來說，開發環境是我第一步要解決的事情。這裡我以Sublime作為編輯器。為什麼選擇sublime？因為他外掛太多了。。所以資源很豐富，恰好也有對Reac

【Julia】Linux下配置Julia互動開發環境（Julia notebook）

0x00 前言近期Julia這門語言突然被拉入了大眾視野，我也是被一句 “Walk as Python，Run as C” 深深的吸引住了，如果它沒有在吹牛，那麼這門語言說不定確實是我所想要的，那麼，學學看吧？本篇文章主要用於介紹如何搭建便於學習與測

【轉】Linux下RabbitMQ服務器搭建（單實例）

ble kernel ror com 使用 board lang and soc 閱讀目錄系統環境安裝步驟註意事項參考資料回到頂部系統環境操作系統：CentOS6.9 erlang：OTP 19.3 rabbitmq：rabbitmq-serve

【轉】windows下使用WebSocket-Node搭建WebSocket伺服器

第一步:安裝好node.js和npm 這個就不贅述了. 在dos命令下測試第二步:安裝WebSocket-Node模組 Node.js command prompt輸入命令 npm install websocket 記住,不要全域性安裝,不然後續呼

【轉】使用vue-cli搭建項目

cnblogs 安裝完成配置 detail pack 文件夾 cache install 需要 vue-cli 是一個官方發布 vue.js 項目腳手架，使用 vue-cli 可以快速創建 vue 項目，GitHub地址是：https://github.com/vuejs

【轉】Ubuntu下外放有聲音耳機沒聲音

新的驅動手機發現停止執行恢復保存機會真是使用linux每天都有新的發現啊，今天早上起來用電腦，想聽幾首歌，插上耳機後發現沒聲音，我還以為是耳機壞了，就把耳機插在了手機上，發現耳機有聲音，很納悶，我象是不是電腦接口有問題了，但是在進系統的時候耳機會響一下，所

【轉】Linux下查看進程打開的文件句柄數

art blog targe 時間 ase 響應時間 nbsp lin repl ---查看系統默認的最大文件句柄數，系統默認是1024 # ulimit -n 1024 ----查看當前進程打開了多少句柄數 # lsof -n|awk ‘{print $2}‘|sort

【轉】idea激活搭建授權服務器

監聽存在命令 jid intel 本地 itl 作者返回 1.下載軟件:磁力鏈接: magnet:?xt=urn:btih:2289E4F8CEB346AC44E54C8C0DA706CC537301AA 復制磁力鏈接地址 magnet:?xt=urn:btih

【轉】Linux下/proc目錄簡介

map kms slab proc文件系統文件格式應用 environ 一段時間內存映射 1. /proc目錄Linux 內核提供了一種通過 /proc 文件系統，在運行時訪問內核內部數據結構、改變內核設置的機制。proc文件系統是一個偽文件系統，它只存在內存當中，而

【轉】Mac下升級python2.7到python3.6

分享 www. blog sso 沒有 python3 pip 讀者 oot 1. 前言 Mac系統自帶python2.7，本文目的是將自帶的python升級到3.6版本。網上有本多的做法是讓python2.7和python3.X兩個版本共存，博主並不知道，是兩版本共存

【轉】linux下各文件夾的結構說明及用途介紹

系統引導制造版本共享應該符號驅動器 window 處理器 linux下各文件夾的結構說明及用途介紹： /bin：二進制可執行命令。 /dev：設備特殊文件。 /etc：系統管理和配置文件。 /etc/rc.d：啟動的配置文件和腳本。 /home：用戶主目錄

【轉】ios下audio不能自動播放的問題

IE 能夠 mov audio head clas cli script device <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8">

【window】Windows10下為PHP安裝redis擴展

5.1 windows10 span round pre pdb 安裝redis擴展 mile bin 操作：步驟1：D:\wamp\bin\apache\apache2.4.9\bin/php.ini中添加 ; php_redis extension=php_igb

【轉】Linux下從TCP狀態機,三次握手判斷DDOS攻擊

pla rep img 實體 -s lar 連接狀態 sdn 類型從TCP狀態機判斷DDOS攻擊一、TCP協議 TCP 協議是傳送層的核心協議，提供了可靠面向連接的協議，分為三次握手和四次斷開，在這個過程中TCP有個狀態機，記錄不同階段的狀態。二、 TCP握手和斷開

【轉】linux下netlink的使用簡介

原博文連線：http://blog.chinaunix.net/uid-24716553-id-5609723.html netlink是一種用於使用者空間程序與核心間通訊的方法，也可以用於使用者程序之間的通訊（IPC）。 netlink和ioctl比較相似，都能從使用者空

【轉】Linux下java程序CPU佔用率高分析方法

文章轉載的地址： https://blog.linuxeye.cn/343.html 在工作當中，肯定會遇到由程式碼所導致的高CPU耗用以及記憶體溢位的情況。這種情況發生時，我們怎麼去找出原因並解決。一般解決方法是通過top命令找出消耗資源高的執行緒id，利用strace命令檢視該執行緒

【轉】Linux下cp: omitting directory `XXX'問題解決

在linux系統中複製資料夾時提示如下： Shell程式碼 [[email protected] site-packages]# cp yagmail /home/hadoop/miniconda3/lib/python3.5/site-packages/ cp: omitti

【轉】linux下設定允許keepalived組播

centos防火牆預設是不允許keepalived使用 vrrp的組播,如果不開啟組播ip,keepalived雙機不能實現熱備的效果,只能實現負載的效果,即虛擬ip不能實現漂移。防火牆開啟keepalived使用組播ip執行一下命令： centos7

【轉】linux下殺死程序（kill）的N種方法

轉載一篇，最原始的出處已不可考，望見諒！常規篇：　首先，用ps檢視程序，方法如下： $ ps -ef …… smx 1822 1 0 11:38 ? 00:00:49 gnome-terminal smx 1823 1

【轉】Windows10下Eclipse搭建Hadoop3開發環境

Windows10下Eclipse搭建Hadoop3開發環境

前言

工具

在Windows上解壓Hadoop3

開放Hadoop的許可權

在Eclipse上安裝Hadoop外掛

執行WordCount例子

打包JAR在linux執行

相關推薦