Eclipse中搭建MapReduce開發環境

阿新 • • 發佈：2019-01-06

一、安裝Eclipse

1、下載-官方網址

2、解壓

tar -zxvf eclipse-committers-oxygen-3a-linux-gtk-x86_64.tar.gz

3、啟動（建立桌面快捷方式）

我們可以直接啟動，進入eclipse解壓目錄使用./eclipse可以直接啟動，但是為了後期方便啟動，可以在桌面建立快捷方式，建立快捷方式步驟如下：

進入/usr/share/applications資料夾，在此資料夾下建立一個eclipse的快捷方式。

 vim eclipse.desktop

在新建檔案中新增如下內容

[Desktop Entry]
Encoding=UTF-8
Name=Eclipse
Comment=Eclipse IDE
Exec=/usr/local/eclipse/eclipse(eclipse存放路徑)
Icon=/usr/local/eclipse/icon.xpm
Terminal=false
Type=Application
Categories=GNOME;Application;Development;
StartupNotify=true

這時，我們可以看到在/usr/share/applacations/資料夾下有了eclipse的快捷方式，最後把eclipse快捷方式複製到桌面就可以啟動了。

二、在Eclipse中安裝Hadoop外掛

1.複製jar包

將hadoop-eclipse-plugin-2.7.1.jar檔案複製到“/usr/local/eclipse/plugins”資料夾下。

2.在Eclipse中設定Hadoop的安裝目錄

重新啟動Eclipse，在主選單中選擇“Window->Preferences”，在彈出的對話方塊中選擇左邊的Hadoop Map/Reduce，然後在右邊的“Hadoop installation directory”中填入Hadoop的安裝目錄，如下圖所示：

圖1 Eclipse中設定Hadoop的安裝目錄

3.建立並配置Map/Reduce Locations

在主選單中選擇“Window->Show View->Other”，在彈出的對話方塊中找到並展開“MapReduce Tools”，然後選擇“Map/Reduce Locations”，如下圖所示：

圖2 在Eclipse中選擇Map/Reduce Locations

返回後出現Map/Reduce Locations子視窗，如下圖所示：

圖3 Map/Reduce Locations子視窗

在“Map/Reduce Locations”子視窗中右鍵單擊，選擇“New Hadoop Location”，建立一個新的Hadoop Location。

圖4 在Eclipse中設定Hadoop Location

說明：Map/Reduce (V2) Master的Host和port是Yarn的主機和埠號，預設埠號是50020。DFS Master的Host和Port需要根據core-site.xml檔案配置。預設埠號是9000。

配置正確後返回主視窗會看到新增的Hadoop Location，如下圖所示：

圖5 成功建立的Hadoop Location

三、開發第一個MapReduce程式

我們以典型的WordCount為例，在Eclipse中編寫第一個MapReduce程式。

1.資料檔案

本次我們繼續使用之前執行系統自帶案例中建立的wordtest.txt檔案，檔案內容如下：

圖6 wordtest.txt檔案內容

2.建立Map/Reduce專案

在Eclipse主選單中，選擇“File->New->Other”，在彈出的對話方塊中選擇“Map/Reduce Project”，如下圖所示：

圖6 建立Map/Reduce專案

圖7 輸入專案名稱

3.編寫程式碼

TokenizerMapper.java

package com.hellohadoop;
import java.io.IOException;
import java.util.StringTokenizer;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;
public class TokenizerMapper extends Mapper<LongWritable, Text, Text, IntWritable>{
	private final static IntWritable one = new IntWritable(1);
	private Text word = new Text();
	public void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
		StringTokenizer itr = new StringTokenizer(value.toString());
		while(itr.hasMoreTokens()) {
			word.set(itr.nextToken());
			context.write(word, one);
		}
	}
}

IntSumReducer.java

package com.hellohadoop;
import java.io.IOException;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;
public class IntSumReducer extends Reducer<Text, IntWritable, Text, IntWritable>{
	private IntWritable result = new IntWritable();
	public void reduce(Text key,Iterable<IntWritable> values,Context context) throws IOException, InterruptedException {
		int sum = 0;
		for(IntWritable val:values) {
			sum += val.get();
		}
		result.set(sum);
		context.write(key, result);
	}
}

WordCount.java

package com.hellohadoop;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;
public class WordCount {
	public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
		Configuration conf = new Configuration();
		String[] otherArgs = new GenericOptionsParser(conf, args).getRemainingArgs();	
Job job = new Job(conf,"word count");
		job.setJarByClass(WordCount.class);
		//指定Mapper類
		job.setMapperClass(TokenizerMapper.class);
		job.setCombinerClass(IntSumReducer.class);
		//指定Reducer類
		job.setReducerClass(IntSumReducer.class);
		//設定Reduce函式輸出key的型別
		job.setOutputKeyClass(Text.class);
		//設定Reduce函式輸出value的型別
		job.setOutputValueClass(IntWritable.class);
		//指定輸入路徑
		FileInputFormat.addInputPath(job, new Path(otherArgs[0]));
		//指定輸出路徑
		FileOutputFormat.setOutputPath(job, new Path(otherArgs[1]));
		System.out.println("OK");
		//提交任務
		System.exit(job.waitForCompletion(true) ? 0 : 1);
	}
}

4.執行程式

首先，要設定程式的輸入引數，右鍵WordCount.java選擇Run As->Run Configurations，如下圖所示：

圖8 為Java Application建立一個新的配置

接著開啟"Arguments"，輸入引數，如下圖所示：

圖9 輸入執行引數

配置完成後，返回主介面，點選Run As->Run on Hadoop，執行結果如下圖所示：

圖10 MapReduce程式執行結果

Eclipse中搭建MapReduce開發環境

一、安裝Eclipse1、下載-官方網址2、解壓 tar -zxvf eclipse-committers-oxygen-3a-linux-gtk-x86_64.tar.gz3、啟動（建立桌面快捷方式）我們可以直接啟動，進入eclipse解壓目錄使用

Windows下，在IDEA中搭建MapReduce開發環境（需基礎，非詳盡篇）

hadoop在官網下載，jdk在官網下載，自行解壓下載的hadoop包，安裝下載的jdk。開啟IDEA，新建專案： File->Project Structure：選擇之前解壓的hadoop資料夾中的share/hadoop目錄下的common

在eclipse上搭建mapreduce開發環境及執行wordcount

1.先說明我的實驗環境： win7, eclipse版本是Neon.2 Release (4.6.2), hadoop2.7.3部署在1master，3slave的叢集上 2.需要下載winutils

Eclipse中zcc-plugin開發環境的搭建

搭建的主要步驟 a). **匯入根證書.cer檔案到jdk中去** b). **設定settings.xml檔案，檔案當中指定remote的url** c). **Maven中的user settings新增Archetype中的Remote的url，並verify** 具體

Windows下基於Eclipse搭建MapReduce開發環境

首先安裝JDK和Eclipse，安裝JDK的教程網上很多，Eclipse下在下來解壓就可以。值的一提的是，JDK和Eclipse的版本需要對應起來。這裡提供一個JDK安裝連結：https://jingyan.baidu.com/article/6dad5075d1dc40a123e36ea3.htm

windows下idea中搭建hadoop開發環境，向遠端hadoop叢集提交mapreduce任務

1.下載hadoop2.6.0-cdh5.6.1,解壓並安裝公司用的hadoop叢集版本是hadoop2.6.0-cdh5.6.1，防止版本衝突，所有的hadoop版本號都用了這個。下載地址：http://archive.cloudera.com/cdh

OSGI企業應用開發（二）Eclipse中搭建Felix執行環境

上篇文章介紹了什麼是OSGI以及使用OSGI構建應用的優點，接著介紹了兩款常用的OSGI實現，分別為Apache Felix和Equinox，接下來開始介紹如何在Eclipse中使用Apache Felix和Equinox搭建OSGI執行環境。一、搭建A

eclipse上搭建hadoop開發環境

hadoop一、概述1.實驗使用的Hadoop集群為偽分布式模式，eclipse相關配置已完成；2.軟件版本為hadoop-2.7.3.tar.gz、apache-maven-3.5.0.rar。二、使用eclipse連接hadoop集群進行開發1.在開發主機上配置hadoop①將hadoop-2.7.3.

在Xcode7中搭建Python開發環境

xcode7 python如果你是從IOS開發轉PYTHON，鐘情於Xcode :)說實話，不好用，也許我用的少？======================================在Xcode7中搭建Python開發環境一、開發環境準備 1、安裝Xcode 2、找到Mac OS X上安裝Pytho

Windows系統下Eclipse上搭建Python開發環境

acl ora .com sdn down win ava ecp http 參考網站： https://blog.csdn.net/zhangphil/article/details/78962159 1、先安裝JDK ，參考網站:https://www.cnblog

【甘道夫】Eclipse+Maven搭建HBase開發環境及HBaseDAO代碼演示樣例

into disable ner except depend strong condition lena esc 環境： Win764bit Eclipse Version:

使用 Laragon 在 Windows 中搭建 PHP開發環境及常見問題解決

PHP的整合開發環境市面上已經有很多非常成熟好用的整合軟體了，比如WAMP, Xampp, PhpStudy等，如今我發現了另一款非常好用的整合軟體Laragon，可能更有利於新手通過PHP整合開發環境，進行web專案開發。安裝我們可以在官網https://laragon

Idea 安裝以及破解，以及在Idea中搭建PHP開發環境

4. php.ini 中增加一下： zend_extension=php_xdebug-2.6.1-7.1.dll [Xdebug] zend_extension_ts=php_xdebug-2.6.1-7.1.dll ;xdebug.remote_host=

eclipse+tomcat搭建javaweb開發環境

相關文章我用的jdk是1.7，eclipse是luna版本，tomcat8.0。都是64位工具下載 eclipse配置tomcat jdk安裝及配置環境變數，網上很多，不再贅述 eclipse和tomcat下載後是一個壓縮包

在 ubuntu18.04 中搭建 Django 開發環境

在Ubuntu 18.04 安裝 python3、pip3、pycharm，搭建 Django 開發環境。 1、安裝 python3 pip3 sudo apt-get install python3 sudo apt-get install python3-pip 2、安裝 pycharm 在官網中

在Ubuntu中搭建.NET開發環境

server { listen 30000; server_name localhost; access_log /var/log/nginx/mono.log; location / {

在Visual Studio2015中搭建OpenGL開發環境（win10）

一、下載OpenGL的GLUT庫 Windows環境下的GLUT官方下載地址：（蘋果機不需要安裝，自帶） OpenGL全部標頭檔案和庫檔案（不包括顯示卡自帶的）連結: http://pan.baidu.com/s/1i3YKhBv 密碼:5x5t 二、O

Windows7作業系統下使用Eclipse來搭建hadoop開發環境

[main] WARN org.apache.hadoop.util.NativeCodeLoader- Unable to load native-hadoop library for your platform... using builtin-javaclasses where applicable

在sublime text 3中搭建Java開發環境

在jdk bin目錄下新建一個bat檔案：如D:\JAVA\jdk1.8.0_65\bin\runJava.bat @ECHO OFF cd %~dp1 ECHO Compiling %~nx1.

Hadoop 在Windows7作業系統下使用Eclipse來搭建hadoop開發環境

2014-12-16 15:34:01,303 INFO [main] Configuration.deprecation (Configuration.java:warnOnceIfDeprecated(996)) - session.id is deprecated. Instead, use dfs.m

Eclipse中搭建MapReduce開發環境

一、安裝Eclipse

二、在Eclipse中安裝Hadoop外掛

三、開發第一個MapReduce程式

1.資料檔案

2.建立Map/Reduce專案

3.編寫程式碼

4.執行程式

相關推薦