hadoop用java API實現mapreduce示例

阿新 • • 發佈：2018-12-22

自定義資料型別bean

package org.hadoop.total;
import org.apache.hadoop.io.Writable;
import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;

/*
 * FlowBean要在節點傳輸，要符合hadoop的序列號機制，實現Writable介面
 * */
public class FlowBean implements Writable {
    //    上行流量
    private long down_flow;
    //    下行流量
    private long up_flow;
    //  總
    private long total;
    //    電話號碼
    private String phone;

    public FlowBean() {
        //為了反射，沒有建構函式的時候不用寫，如果有別的建構函式這裡必須寫
    }


    public FlowBean(String phone, long up_flow, long down_flow) {
        this.phone = phone;
        this.up_flow = up_flow;
        this.down_flow = down_flow;
        this.total = up_flow + down_flow;
    }


    public long getDown_flow() {
        return down_flow;
    }

    public long getUp_flow() {
        return up_flow;
    }

    public long getTotal() {
        return total;
    }

    //資料寫入輸出流
    public void write(DataOutput out) throws IOException {
// 寫進位元組陣列
        out.writeUTF(phone);
        out.writeLong(up_flow);
        out.writeLong(down_flow);
        out.writeLong(total);
    }

    //讀取要傳遞的資料,讀取的順序要和寫的一致，先進先出
    public void readFields(DataInput in) throws IOException {
// 讀出位元組陣列
        phone = in.readUTF();
        up_flow = in.readLong();
        down_flow = in.readLong();
        total = in.readLong();
    }

    @Override
    public String toString() {
        return ""+up_flow+"-"+down_flow+"-"+total;
    }

}

map程式

package org.hadoop.total;

import org.apache.commons.lang.StringUtils;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;

/*
* 輸入key:LongWritable,起始偏移量
* 輸入value:Text,每行的文字
* 輸出key:Text,電話號碼
* 輸出value:bean
*
* */
public class FlowSunMapper extends Mapper<LongWritable,Text,Text,FlowBean> {
//    map方法會自動傳人一行資料value
//    key是輸入的key
//    context是輸出用的封裝類
    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
        String string = value.toString();  // 獲得一行資料
        String[] arr = StringUtils.split(string, "\t");
        String phonenum = arr[1];
        long u_flow = Long.parseLong(arr[7]);
        long d_flow = Long.parseLong(arr[8]);
        //map的資料要用context封裝
        context.write(new Text(phonenum), new FlowBean(phonenum,u_flow,d_flow));

    }
}

reduce方法

package org.hadoop.total;

import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

import java.io.IOException;


public class FlowSunReducer extends Reducer<Text,FlowBean,Text,FlowBean> {

    // key是鍵值
//  values 是{flowbean,flowbean,flowbean,flowbean,flowbean}
    @Override
    protected void reduce(Text key, Iterable<FlowBean> values, Context context) throws IOException,InterruptedException
    {
        long down_flow_counte = 0;
        long up_flow_counte = 0;

        for (FlowBean bean:values)
        {
            up_flow_counte = up_flow_counte+bean.getUp_flow();
            down_flow_counte= down_flow_counte+bean.getDown_flow();
        }
        context.write(key, new FlowBean(key.toString(),up_flow_counte,down_flow_counte));
    }
}

主方法

package org.hadoop.total;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.conf.Configured;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.Tool;
import org.apache.hadoop.util.ToolRunner;

public class FlowSunRuner extends Configured implements Tool {
    public int run(String[] args) throws Exception {
        Configuration conf = new Configuration();
        conf.set("fs.defaultFS", "hdfs://hadoop101:9000/");
        // 建立一個job
        Job job = Job.getInstance(conf);
        job.setJarByClass(FlowSunRuner.class);
        //設定map
        job.setMapperClass(FlowSunMapper.class);
        //設定reduce
        job.setReducerClass(FlowSunReducer.class);
        //設定輸入
        job.setMapOutputValueClass(FlowBean.class);
        job.setMapOutputKeyClass(Text.class);
        //設定輸出
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(FlowBean.class);
        
        System.out.println(args);
        //給定輸入
        FileInputFormat.setInputPaths(job,new Path("hdfs://192.168.117.101:9000/HTTP_20130313143750.dat"));
        //給定輸出
        FileOutputFormat.setOutputPath(job, new Path("hdfs://192.168.117.101:9000/out/test/"));
        
        return job.waitForCompletion(true)?0:1;
    }

    public static void main(String[] args) throws Exception
    {
        int run = ToolRunner.run(new Configuration(), new FlowSunRuner(), args);
    }
}

hadoop用java API實現mapreduce示例

自定義資料型別bean package org.hadoop.total; import org.apache.hadoop.io.Writable; import java.io.DataInput; import java.io.DataOutput; import java.i

hadoop用java API實現mapreduce排序

mapreduce排序依靠的是key鍵，所以要在輸出的key對應的類實現compareTo（）方法 #key對應的類 package org.hadoop.sort; import org.apache.hadoop.io.Writable; import org.apache

（4）通過呼叫hadoop的java api實現本地檔案上傳到hadoop檔案系統上

（1）首先建立java project 選擇eclipse選單上File->New->Java　Project。並命名為UploadFile。（2）新增必要的hadoop jar包右鍵選擇JRE System Library，選擇

Java API實現Hadoop文件系統增刪改查

代碼實現 java api cee 其他 mon prop com null -c Java API實現Hadoop文件系統增刪改查 Hadoop文件系統可以通過shell命令hadoop fs -xx進行操作，同時也提供了Java編程接口 maven配置 <proj

Hadoop分散式檔案系統利用 java API 實現

（前提：自己的linux系統中的叢集已搭建完畢 )1 . 首先在電腦中安裝 hadoop 配置環境變數：右鍵點選“計算機”--> 屬性 --> 高階系統設定 --> 環境變數建立一個 “HADOOP_HOME”，值為hadoop安裝

Tcl腳本調用高層API實現儀表使用和主機創建配置的自己主動化測試用例

sub ret eat ati 包含 lin name ref config #設置Chassis的基本參數，包含IP地址。port的數量等等 set chassisAddr 10.132.238.190 set islot 1 set portList {11 12

調用天氣api實現查詢各城市天氣

mgo inpu gfw scp bpa avd tpc ops sel 調用的api數據為haoservice.com網站提供的天氣數據。如下圖，我們需要向其傳遞的參數有兩個，一個為我們自己申請的key，一個為城市名字。首先定義兩個變量，一個存儲key，一個存儲

Hadoop HDFS Java API

Hadoop HDFS Java [toc] Hadoop HDFS Java API 主要是Java操作HDFS的一些常用代碼，下面直接給出代碼： package com.uplooking.bigdata.hdfs; import org.apache.hadoop.conf.Config

用java語句實現n的階乘

static blog ati body void 結果實現 sys string import java.util.Scanner;public class 階乘 { public static void main(string[] args){

hadoop hdfs (java api)

gpo IT miss 方法上傳下載 lose before AI lib 簡單介紹使用java控制hdfs文件系統一、註意namenode端訪問權限，修改hdfs-site.xml文件或修改文件目錄權限本次采用修改hdfs-site.xml用於測試，在configu

調用zabbix API實現批量管理主機及個監控項

nta mps 返回 eid cati png 輸入 sha min 首先貼上zabbix官網和中文官網的地址：　　https://www.zabbix.com/documentation/3.4/manual/api/reference/item/object 　　ht

用java來實現接收感測器裡面的溫溼度、各種氣體、大氣壓

之前主要依靠公司裡面一個同事用vb編的程式，因為我不知道crc校驗是怎麼出來的，為了趕專案用了vb,然後用java 呼叫資料庫裡面的資料；但是一個專案應該統一語言的；我需要接受如下感測器資訊感測器（-130米主通風井） 192.168.1

用java程式設計實現集合的交、並、差和補運算

一、實驗目的掌握集合的交、並、差和補運算，並且使用計算機程式設計實現。二、實驗內容通過程式設計實現求給定集合A和B的並集C（C=A∪B）、交集C（C=A∩B）、差集C（C=A-B）、補集~C=E-C的運算。三、實驗要求 C、C＋＋

用java robot 實現關閉他人計算機（僅限於安裝了java虛擬機器的使用者）

很多時候，我們希望能夠實現自動測試，自動演示功能，或者是其它的一些滑鼠和鍵盤控制的應用（比如幫人點選廣告賺利潤等）。出於這樣的目的，自從JDK1.3開始，它就為我們提供了一個用來產生本機輸入事件的機器人類 — java.awt.Robot. 下面我來詳細介紹Ro

怎麼用Java來實現控制Tomcat啟動與停止？

停止 //如不能執行，請正確配置tomcat環境 public class conTomCat{ public void close() throws IOException { Process process = Runtime.getRuntime().exec('cmd

用java陣列實現棧

棧是一種常見的資料結構。如果用一句話來概括棧的特點，估計大部分同學都能脫口而出：後進先出，即先進來的元素儲存在棧的最底部，新來的元素則在棧頂堆積，直到棧滿為止；而取元素的時候，只能從棧頂取，直到棧空為止。整個過程，與摞書的過程很類似：放書的時候都是摞在最上面，取

Elasticsearch用java api 建立mapping

https://blog.csdn.net/cardinalzbk/article/details/53537254 https://blog.csdn.net/napoay/article/category/6507166/2 https://blog.csdn.net/napoa

(3) 用java編譯器實現一個簡單的編譯器-語法分析

轉載地址：http://blog.csdn.net/tyler_download/article/details/50708807 視訊地址：http://study.163.com/course/courseLearn.htm?courseId=1002830012#/l

（2）Hadoop核心 -- java程式碼對MapReduce的例子1

案例一：wordcount字數統計功能 1.1 先準備兩個txt檔案，並上傳到hdfs上 test1.txt hello zhangsan lisi nihao hai zhangsan nihao lisi x xiaoming test2.txt zha

（2）Hadoop核心-java程式碼對MapReduce的操作

上一篇檔案介紹了java程式碼怎麼操作hdfs檔案的，hdfs理念“就是一切皆檔案”，我們現在搞定了怎麼使用java上傳下載等操作了接下來就要處理檔案了，hadoop的mapreduce模組。一、Hadoop Map/Reduce框架

hadoop用java API實現mapreduce示例

自定義資料型別bean

map程式

reduce方法

主方法

相關推薦