MapReduce實現sql的查詢功能

阿新 • • 發佈：2018-12-30

查詢員工表中部門所有人的工資總和

SQL 語句為：select deptno , sum(sal) from emp group by deptno order by deptno;

下面用MapReduce程式來實現對該SQL語句相同的查詢功能

Mapper程式如下:

package SalaryTotal;

import java.io.IOException;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

public class SalaryTotalMapper extends Mapper<LongWritable, Text, IntWritable, IntWritable> {

	@Override
	protected void map(LongWritable key1, Text value1,Context context)
			throws IOException, InterruptedException {
		
		/*
		 * context  表示Mapper的上下文
		 * 上文：HDFS
		 * 下文：Mapper
		 */
		//資料：7900,JAMES,CLERK,7698,1981/12/3,950,,30
		String data = value1.toString();
		
		//分詞
		String[] words = data.split(",");
		
		//輸出   k2部門號      v2薪水
		for(String w:words) {
			context.write(new IntWritable(Integer.parseInt(words[7])), new IntWritable(Integer.parseInt(words[5])));
		}
	}
	
}

Reducer程式如下：

package SalaryTotal;

import java.io.IOException;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.mapreduce.Reducer;

public class SalaryTotalReucer extends Reducer<IntWritable, IntWritable,IntWritable ,IntWritable> {

	@Override
	protected void reduce(IntWritable k3, Iterable<IntWritable> v3,Context context)
			throws IOException, InterruptedException {
		
		//對v3求和，得到該部門的工資總額
		int total = 0;
		for(IntWritable v:v3) {
			total += v.get();
		}
		
		//輸出
		context.write(k3, new IntWritable(total));
	}
	
}

主程式如下：

package SalaryTotal;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class SalaryTotalMain {
	public static void main(String[] args) throws Exception {
		//建立一個job
		Job job = Job.getInstance(new Configuration());
		job.setJarByClass(SalaryTotalMain.class);
		
		//指定job的mapper和輸出的型別  k2   v2
		job.setMapperClass(SalaryTotalMapper.class);
		job.setMapOutputKeyClass(IntWritable.class);
		job.setMapOutputValueClass(IntWritable.class);
		
		//指定job的reducer和輸出的型別   k4 v4
		job.setReducerClass(SalaryTotalReucer.class);
		job.setOutputKeyClass(IntWritable.class);
		job.setOutputValueClass(IntWritable.class);
		
		//指定job的輸入和輸出的路徑
		FileInputFormat.setInputPaths(job, new Path(args[0]));
		FileOutputFormat.setOutputPath(job, new Path(args[1]));
		
		//執行任務
		job.waitForCompletion(true);
	}
}

在Hadoop上執行此MapReduce程式

hadoop jar salary.jar /scott/emp.csv /output/0814/salary

檢視執行的結果

由此結果可以看出，此MapReduce程式和SQL 語句的執行結果一樣，即MapReduce程式正確。

MapReduce實現sql的查詢功能

查詢員工表中部門所有人的工資總和 SQL 語句為：select deptno , sum(sal) from emp group by deptno order by deptno; 下面用Map

python 實現使用者查詢功能

import os def file_handler(backend_data,res=None,type='fetch'): if type == 'fetch': with open('pll.t','r') as pl:

Spark SQL簡介及以程式設計方式實現SQL查詢

1.什麼是SparkSQL？ Spark SQL是Spark用來處理結構化資料的一個模組，它提供了一個程式設計抽象叫做DataFrame並且作為分散式SQL查詢引擎的作用。 2.SparkSQL的特點：我們已經學習了Hive，它是將Hive SQL轉換成M

15-二分查詢（上）：圖和用最省記憶體的方式實現快速查詢功能？

今天我們講一種針對有序資料集合的查詢演算法：二分查詢（Binary Search）演算法，也叫折半查詢演算法。二分查詢的思想非常簡單，很多非計算機專業的同學很容易就能理解，但是看似越簡單的東西往往越難掌握好，想要靈活應用就更加困難。老規矩，我們還是來看一道思考

實現帶查詢功能的ComboBox控制元件

實現效果：　　知識運用：　　ComboBox控制元件的AutoCompleteMode屬性　　public AutoCompleteMode AutoCompleteMode{get;set;}　　//屬性值為列舉值之一　　和AutoCompleteSource屬性　　public A

微信小程式實現快遞查詢功能（介面傳值、JSON資料請求和解析、radio-group的使用...）

執行效果：請求資料之前需要首先在小程式平臺設定伺服器域名第一個介面的實現：介面傳值、radio-group的使用 first.wxml <!--first.wxml--&g

Oracle 動態SQL實現SQL查詢子集行轉列

引言我們都知道Oracle的Pivot的In（）裡是不能跟SQL查詢語句的，必須是已知的字串結果，然而我專案中遇到的需求這個In 並不是靜態的，而是根據我傳遞的條件來篩選，一開始想的是解析XML，可惜轉為XML之後，有相同的重複的節點，解析太麻煩，於是想通過

mybatis實現sql查詢in（）語句

現象：使用ssm框架 mybaits使用的sql語句中包含in（）語句在java中該如何實現比如：sql語句如下： DELETE FROM tbl_channel_sms_depl

Hibernate中使用@Query實現模糊查詢功能

用@Query實現模糊查詢功能：示例程式碼 1、Dao層寫法： @Query("select m from Member m where m.nickname like ?1 escape '/' and m.enabled = true order

HttpGet方式呼叫有道詞典API實現單詞查詢功能

import java.io.IOException; import java.util.List; import java.util.Scanner; import org.apache.http.HttpEntity; import org.apache.http.H

Mysql實現文章查詢上一篇和下一篇功能，附sql語句?

mysql實現文章查詢上一篇和下一篇功能，附sql語句? Mysql實現文章查詢上一篇和下一篇功能，sql語句： 1 (select * from articles where id < #id# order by id desc limit 1)

利用Mybaties註解動態Sql實現查詢功能（表名不固定）

最近開發過程中，資料庫的表名是日表，每次查詢需要動態傳入表名，所以需要動態拼接sql 一.mapper介面，呼叫provider類，該類返回sql(RecordProvider需要自己新建一個class) 二.Provider.class，利用StringBuid

C#實現百度網站收錄和排名查詢功能思路及實例

重構策略 www protected 交互得出完成 def 表達式一、前言偶然一次在vs2012默認的項目文件夾裏發現了以前自己做的一個關於SEO的類庫，主要是用來查詢某個網址的收錄次數還有網站的排行數，後來重構了下，今天拿出來寫篇文章，說說自己是如何思考的

Python與數據庫[2] -> 關系對象映射/ORM -> 利用 sqlalchemy 實現關系表查詢功能

none 標準 ica accounts like imp 函數參數形式 char 利用 sqlalchemy 實現關系表查詢功能下面的例子將完成一個通過關系表進行查詢的功能，示例中的數據表均在MySQL中建立，建立過程可以使用 SQL 命令或編寫 Python

基於bootstrap selectpicker ，實現select下拉框模糊查詢功能

sele TP 選擇器 art 基於 i++ 同時 html .html 1、html代碼塊需要引入bootstrap的css js jquery bootstrap.css bootstrap-select.min.css jquery-

帶輸入查詢功能匹配下拉框的幾種實現方式

sae idt hwnd 就會 bfd bmgr 使用方法 oaf adt 在Web開發中我們經常需要用戶進行輸入操作，輸入框內我們輸入幾個字，輸入框就會出現下拉提示你可能要輸入的完整信息。下面我總結了幾種常見的方案：一：EasyUi combobox 組合框具體使用方

django實現查詢功能

use dia ext bubuko var pull arc settings bsp 1.index首頁顯示 <div class="form-group pull-right" style="float: left"&g

poscms基於list標簽實現的查詢分頁功能

span utf 我們 cms rtti png bsp 控制 start poscms系統本身有一個在查詢頁（search頁面）實現的查詢分頁功能，基於系統封裝的php函數dr_search_url() 但是今天的需求除了導航欄、列表頁、詳情頁都實現查詢功能外，關鍵是有

如何實現在客戶端或瀏覽器頁面中整合一個類似plsqldeveloper一樣的查詢功能?

轉載：https://ask.csdn.net/questions/703108 qq_16127313 https://gitee.com/00fly/effict-side/tree/master/dbtool-springboot 專案運維過程中，受到客戶機房管理

node實現電影列表排序、按照區間查詢功能、去重功能、搜尋功能

目標電影列表排序、按照區間查詢功能、去重功能、搜尋功能複習：eval函式的使用場景、陣列去重（至少你要懂得6種）排序 ---- **.**.find().sort() ------ （查詢所有的資

MapReduce實現sql的查詢功能

相關推薦