如何在開發環境中建立mapreduce程式

阿新 • • 發佈：2019-01-24

1. 首先建立開發環境（eclipse-hadoop），網上搭建部落格很多，不細說

2. 開發環境建立之後自己建立一個包，這個名字是隨便起的，可以起名為mapreduce。

3.然後建立一個.java檔案，可以是mapreduce檔案：mapreduce.java。

4.把下面程式碼放入放入mapreduce.java

5.建立mapreduce程式。

package mapreduce;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.output.*;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;
import org.apache.hadoop.mapreduce.lib.partition.HashPartitioner;

public class mapreduce {

static final String INPUT_PATH = "hdfs://master:8020/input";
static final String OUT_PATH = "hdfs://master:8020/Output";

public static void main(String[] args) throws Exception {
//主類
Configuration conf = new Configuration();
final Job job = new Job(conf, mapreduce.class.getSimpleName());
job.setJarByClass(mapreduce.class);
// 尋找輸入
FileInputFormat.setInputPaths(job, INPUT_PATH);
// 1.2對輸入資料進行格式化處理的類
job.setInputFormatClass(TextInputFormat.class);
job.setMapperClass(MyMapper.class);

// 1.2指定map輸出型別<key,value>型別
job.setMapOutputKeyClass(Text.class);
job.setMapOutputValueClass(LongWritable.class);

// 1.3指定分割槽
job.setPartitionerClass(HashPartitioner.class);
job.setNumReduceTasks(1);

// 1.4排序分組省略，使用預設
// 1.5規約省略，使用預設
job.setReducerClass(MyReduce.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(LongWritable.class);
// 指定輸出路徑
FileOutputFormat.setOutputPath(job, new Path(OUT_PATH));
// 指定輸出的格式或則類
job.setOutputFormatClass(TextOutputFormat.class);

// 把作業提交給jobtracer
job.waitForCompletion(true);

}
//map類
static class MyMapper extends
Mapper<LongWritable, Text, Text, LongWritable> {
protected void map(LongWritable key, Text value, Context context)
throws IOException, InterruptedException {
final String[] splited = value.toString().split("\t");
for (String word : splited) {
context.write(new Text(word), new LongWritable(1L));

}

}

}
//reduce類
static class MyReduce extends
Reducer<Text, LongWritable, Text, LongWritable> {
@Override
protected void reduce(Text k2, java.lang.Iterable<LongWritable> v2s,
Context ctx) throws java.io.IOException, InterruptedException {
long times = 0L;
for (LongWritable count : v2s) {
times += count.get();
ctx.write(k2, new LongWritable(times));
}

}

}

}

如何在開發環境中建立mapreduce程式

1. 首先建立開發環境（eclipse-hadoop），網上搭建部落格很多，不細說 2. 開發環境建立之後自己建立一個包，這個名字是隨便起的，可以起名為mapreduce。 3.然後建立一個.java檔案，可以是mapreduce檔案：mapreduce.java。 4.把

Hadoop學習3-Macbook環境在IDEA中編寫MapReduce程式

Hadoop學習3-Macbook環境在IDEA中編寫MapReduce程式新建一個Maven專案不用說了，普通的Maven專案就行。加入Hadoop依賴其中的${hadoop.version}對應自己使用的Hadoop版本 hadoop-client

在VS開發環境中的一些Hits

its 原因 source 註冊 http tag data evel 及其默認前提：Windows7系統 1. 以快速打開管理權限下的VS 通常當默認帳戶權限不夠的時候，同時需要以管理權限運行VS時，每次都要右鍵點擊選擇管理員權限啟動。及其麻煩，可以一次性解決

嵌入式開發環境的建立- 建立宿主主機開發環境

測試直接 not 下載使用 ports 可執行 port 知識庫原地址：http://blog.csdn.net/duwchy/article/details/1612878 在進行嵌入式3D等開發，必須有一臺x86的PC機作為宿主機，絕大多數的 Linux

不允許用(a+b)/2這種方式求兩個數的均值；如下程序在Linux和32位集成開發環境中運行

left 定義 inf log post efi mage 技術 def #define MAX(a,b) ((a)>(b)?(a):(b)) #include<stdio.h> int main() { int a = 10; int

Idea開發環境中搭建Maven並且使用Maven打包部署程序

dfa 下一步 user 利用 line 添加想要 pos 發布閱讀目錄1.配置Maven的環境變量2.Idea開發環境中搭建Maven3.使用Maven開發JavaWeb項目(Idea14)4.使用Maven打包JavaWeb項目回到頂部1.配置Maven的環境變量　

windows下虛擬環境中建立Django專案（建立虛擬環境，安裝virtualenv，安裝Django，建立專案）

一、建立虛擬環境 pip install virtualenv1 要使用Django，首先要建立一個虛擬工作環境。我們先為專案建立一個資料夾learn，在資料夾中開啟命令列（shift+右擊），來建立另一個虛擬環境。如果使用的是python 3，可使

Eclipse搭建安卓開發環境中的問題記錄

注意： 1.Genymotion路徑設定要精確到Genymotion 2.Eclipse 提示 “This version of the rendering library is more recent than your version of ADT plug-in

如何在虛擬環境中建立django專案

1.建立一個工作目錄demo 2.建立虛擬環境：virtualenv rrdTest 3.進入cd rrdTest/Scripts 4.啟用虛擬環境：activate 5.安裝django： pip install django 6.建立django專案：django-admin st

ElasticSearch最佳入門實踐（八）shard & replica 機制梳理以及單 node 環境中建立 index

1、shard & replica 機制梳理（1）index包含多個shard （2）每個shard都是一個最小工作單元，承載部分資料，lucene例項，完整的建立索引和處理請求的能力（3

構造Scala開發環境並建立ApiDemos示例專案

從2011年開始寫Android ApiDemos 以來，Android的版本也更新了很多，目前的版本已經是4.04。ApiDemos中的例子也增加了不少，有必要更新Android ApiDemo示例解析系列文章（當然之前的文章還是有用的，依然可以作為參考）。為了不重複之前的

在JAVA開發環境中部署WAR包

購買阿里雲本來我是沒做過運維方面的工作，挺感興趣的，開開心心地去註冊了一個賬戶併購買了一年伺服器的使用。開啟控制檯如圖所示，因為專案很小，只是做一個Demo出來看一個就好了，就決定買1核2G，作業系統是CentOS 7.3。事實證明這個效能還可

JNI和NDK開發(1)_建立JNI程式

開始學習JNI開發技術，在網上看了很多文章，但講解的都是基礎或者過時的技術，沒有系統的關於JNI和NDK的學習教程，現在我寫《JNI和NDK開發》系列文章，主要是記錄自己從零開始學習遇到的一些問題和知識點，希望對大家也有些幫助。對於文章，本人也是邊學邊寫，所以可能會更新的慢一點

將潤乾報表整合到開發環境中

很多剛剛接觸潤乾報表的客戶在使用過程中，會遇到一個比較頭疼的問題，就是如何將製作好的報表繼承到自己的開發環境中。下面以myEclipse為例，搭建一個簡單的整合潤乾報表的開發環境。首先，開啟myEclipse，建立一個名為runqian的web工程。建立好工程的雛

10.Elastic Search單node環境中建立index

1、shard&replica機制再次梳理（1）index包含多個shard （2）每個shard都是一個最小工作單元，承載部分資料，lucene例項，完整的建立索引和處理請求的能力（3）增減節點時，shard會自動在nodes中負載均衡（4）primary shard和r

eclipse c +jre開發環境的建立（嵌入式linux，64位ubuntu，32位arm板）

1.64位ubuntu安裝使用32位交叉編譯器arm-2010.09需要注意的問題在使用之前先安裝cross compiler，系統為ubuntu64位系統，安裝之前用的32位的arm-2010.09,該編譯器只能編譯32位程式，因此還需安裝32位的庫，可參考：http://www.o

Eclipse中執行MapReduce程式控制臺無除錯資訊-log4j

在Eclipse中執行MapReduce程式，引數設定都正確的情況下，執行時控制檯的輸出為： log4j:WARN No appenders could be found for logger (or

wampserver整合開發環境中的phpMyAdmin打不開的問題

裝了一個wampserver整合開發環境，之後學javaweb又裝了一個mysql。事隔一年用到php做專案，發現wampserver整合開發環境中的phpMyAdmin打不開了。原因是後來裝的mysql 的密碼重新整理了整合環境中的mysql密碼。

NDK開發_AndroidStuido中建立和編譯ndk流程

一、根據native類生成 native類的標頭檔案 1> 如下圖所示，com.lhs.serial.ObdNative 是自己建的native類； 2> cmd 切到工程的java目錄下，輸入 javah -d ../

64位WIN7+VS2012搭建Opencv開發環境中遇到的問題

最近想學習下opencv來著，於是動手在自己機器上搭建開發環境。但是按照網上給出的各種教程來做都會出現連結出錯的問題，vs提示無法解析各種外部符號…… 嘛，其實呢，點選工具欄上的解決方案平臺，在下拉選單裡面選x64就好了~ 如果沒有x64選項的話，在

如何在開發環境中建立mapreduce程式

相關推薦