MapReduce部分API程式設計練習（好友推薦）

阿新 • • 發佈：2018-12-11

1、主方法

package com.bjsxt.FOF;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class MyFOF {
	public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
		Configuration conf=new Configuration(true);
		Job job=Job.getInstance(conf);
		job.setJarByClass(MyFOF.class);
		job.setJobName("ooxx");
		
		Path filein=new Path("/user/local");
		FileInputFormat.addInputPath(job, filein);
		
		Path fileout=new Path("/data");
		if(fileout.getFileSystem(conf).exists(fileout)) {
			fileout.getFileSystem(conf).delete(fileout);
		}
		FileOutputFormat.setOutputPath(job, fileout);
		
//		job.setInputFormatClass(cls);
		
		job.setMapperClass(MyMapper.class);
		job.setMapOutputKeyClass(Text.class);
		job.setMapOutputValueClass(IntWritable.class);
		
//		job.setPartitionerClass(MyPartitioner.class);
//		job.setSortComparatorClass(MyComparator.class);
//		job.setGroupingComparatorClass(MyGrouping.class);
		
//		job.setCombinerClass(MyCombiner.class);
		
		job.setReducerClass(MyReducer.class);
		job.setNumReduceTasks(2);
		
		job.waitForCompletion(true);		
	}
}

2、map方法

package com.bjsxt.FOF;

import java.io.IOException;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.util.StringUtils;

public class MyMapper extends Mapper<LongWritable, Text, Text, IntWritable>{
	Text mkey=new Text();
	IntWritable mval=new IntWritable();
	@Override
	protected void map(LongWritable key, Text value, Mapper<LongWritable, Text, Text, IntWritable>.Context context)
			throws IOException, InterruptedException {
		
		//相同的key為一組，這一組key呼叫一次reduce方法
		//value::::tom hello hadoop cat
		String[] split = StringUtils.split(value.toString(),' ');
		for(int i=1;i<split.length;i++) {
			mkey.set(getfof(split[0],split[i]));
			mval.set(0);
			context.write(mkey, mval);
			
			for(int j=i+1;j<split.length;j++) {
				mkey.set(getfof(split[i],split[j]));
				mval.set(1);
				context.write(mkey, mval);
			}
		}
	}
	public static String getfof(String s1,String s2) {
		if(s1.compareTo(s2)<0) {
			return s1+":"+s2;
		}else {
			return s2+":"+s1;
		}
	}

}

3、reduce方法

package com.bjsxt.FOF;

import java.io.IOException;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapred.MRBench.Reduce;
import org.apache.hadoop.mapreduce.Reducer;

public class MyReducer extends Reducer<Text, IntWritable, Text, IntWritable>{
	
	IntWritable rval=new IntWritable();
	@Override
	protected void reduce(Text key, Iterable<IntWritable> values,
			Reducer<Text, IntWritable, Text, IntWritable>.Context context) throws IOException, InterruptedException {
		//相同的key為一組，這一組資料呼叫一次reduce方法
		//方法內迭代這一組資料
		//hadoop：hadoop 0
		int flag=0;
		int sum=0;
		for(IntWritable v:values) {
			if(v.get()==0) {
				flag=1;
			}
			sum+=v.get();
			if(flag==0) {
				rval.set(sum);
				context.write(key, rval);
			}			
		}	
	}
}

MapReduce部分API程式設計練習（好友推薦）

1、主方法 package com.bjsxt.FOF; import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path;

Leetcode程式設計練習（C++實現）

7、反轉整數 /* 題目描述: 給定一個 32 位有符號整數，將整數中的數字進行反轉。基本思想： 1、類似於字串的逆置，取x的最低位（個位）數字：pop = x % 10; 2、求結果： rev = rev * 10 + pop； 3、將 x 更新為: x

JavaScript高階指令碼演算法程式設計練習（W3C學院）

JavaScript指令碼演算法程式設計實戰課程目錄 1、判斷電話號碼演算法挑戰如果傳入字串是一個有效的美國電話號碼，則返回 true.使用者可以在表單中填入一個任意有效美國電話號碼. 下面是一些有效號碼的例子(還有下面測試時

JS部分練習（書寫計算器）

<html> <head> <title>js的計算器案例</title> <meta charset="UTF-8"/>  <style type="text/css"&

程式設計練習（1）

題目： 1 有這樣一個數字，ABCD * E ==DCBA ，其中各個數字不相等，編寫一個程式，計算出ABCD各代表什麼數字。 #include <stdio.h> int fun(int i,i

MapReduce利用API程式設計的框架示例

排序器分組器分割槽器，打成K,V,P的形式 buffer緩衝區是環形的，buffer環形緩衝區環形緩衝區完了的時候，需要手動寫一個比較器comporator 之後是combiner聚合 //這裡是配置層 Configuration conf=new

JAVA 面向物件程式設計練習（一個回合制的戰鬥遊戲：戰士，騎兵，法師，電腦互相攻擊）

一. 小編有話說前面一篇文章寫了JAVA面向物件程式設計的思想，本文主要展示關於面向物件程式設計的例項（一個回合制的戰鬥遊戲：戰士，騎兵，法師，電腦互相攻擊），小編的基礎暫時薄弱，如此一來有助於更深入的理解和靈活的運用，以及打下堅實的基礎。二. 遊戲的要求

C#程式設計練習（03）：北斗時間系統、GPS時間系統及其與UTC時間系統之間的轉換

需求說明：北斗周-周內秒轉化為日曆時，轉化為UTC時，轉化為GPS週週內秒 GPS周-周內秒轉化為日曆時，轉化為UTC時，轉化為北斗周-周內秒設計示意圖：原始碼： using System; using System.Collections.Generic; using S

C#程式設計練習（02）：大地座標系（LBH）向空間直角座標系（XYZ）的轉換及其逆轉換

需求說明：以WGS-84軟體為例，實現大地座標系（LBH）向空間直角座標系（XYZ）的轉換及其逆轉換原理說明：程式原始碼： using System; using System.Collections.Generic; using System.Linq; using S

Flink程式設計練習（二）

Map 班級學生成績的隨機生成輸入：本班同學的學號輸出：<學號，成績> 資料準備首先需要一個stuID.csv檔案，每一列為一個學號：然後將檔案放入HDFS中： hdfs d

Flink程式設計練習（一）

Flink程式設計練習，NYC計程車資料環境配置本專案參考這裡，setup。首先確保已經下載好flink依賴，並從Github下載程式碼。下載依賴資料，這裡依賴的是紐約出租車資料，可以使用命令列下載： wget http

C語言程式設計練習（一）

問題描述：.給出一個英語句子，希望你把句子裡的單詞順序都翻轉過來　　輸入樣例：I love you 　　輸出樣例：you love I 1 /**********************************************************

C# winform的WebBrowser非常規程式設計（強烈推薦）

http://www.cnblogs.com/sexintercourse/p/6063512.html 1、在WebBrowser中實現抓取301和302協議在WebBrowser中抓取301和302協議目前官方提供的元件遠遠不夠，需要藉助HttpMonitor

Linux程序間通訊(IPC)程式設計實踐（十二）Posix訊息佇列--基本API的使用

posix訊息佇列與system v訊息佇列的差別：（1）對posix訊息佇列的讀總是返回最高優先順序的最早訊息，對system v訊息佇列的讀則可以返回任意指定優先順序的訊息。（2）當往一個空佇列放置一個訊息時，posix訊息佇列允許產生一個訊號或啟動一個執行緒，

分支程式設計練習（初學者）

例：輸入三個整數，輸出最大值和最小值。 #include<stdio.h> int main() { int a,b,c,max,min; printf("input three numbers:");

Linux C程式設計練習（一）

1、定製自己的ls命令 #include <stdio.h> #include <sys/types.h> #include <dirent.h> #include <stdlib.h> #include &

MapReduce 2.0程式設計實踐（涉及多語言程式設計）

Hadoop提供了三種程式設計方式：Java（最原始的方式、Hadoop Streaming（支援多語言）以及Hadoop Pipes（支援C/C++）。Java程式設計介面是所有程式設計方式的基礎。不同的程式設計介面只是暴露給使用者的形式不同而已，內部執

DOM程式設計練習（一）

1、製作頁面版的資產折舊計算器。需求：使用者在頁面上錄入資產原價、折舊率以及計算年限，單擊“計算”按鈕後，計算該資產的折舊價值並顯示在頁面上。 ==========================

【杭電100題】C語言程式設計練習（三）2014 青年歌手大獎賽_評委會打分

http://acm.hdu.edu.cn/showproblem.php?pid=2014Problem Description青年歌手大獎賽中，評委會給參賽選手打分。選手得分規則為去掉一個最高分和一個最低分，然後計算平均得分，請程式設計輸出某選手的得分。Input輸入資料

[hadoop2.7.1]I/O之SequenceFile最新API程式設計例項（寫入、讀取）

寫操作根據上一篇的介紹，在hadoop2.x之後，hadoop中的SequenceFile.Writer將會逐漸摒棄大量的createWriter（）過載方法，而整合為更為簡潔的createWriter()方法，除了配置引數外，其他的引數統統使用SequenceFil

MapReduce部分API程式設計練習（好友推薦）

相關推薦