spark 自定義排序詳解

阿新 • • 發佈：2019-02-05

目的:

排序輸出資料是資料處理的常見操作，本篇部落格示例解決元組、字串按照key、value進行單值、多值自定義排序問題。

程式碼

package LoadTest

import org.apache.log4j.{Logger, Level}
import org.apache.spark.{SparkConf, SparkContext}

object CustomSortBy {

  def main (args: Array[String]){

    //遮蔽不必要的日誌顯示在終端上
    Logger.getLogger("org.apache.spark").setLevel(Level.WARN)
    Logger.getLogger("org.eclipse.jetty.server").setLevel(Level.OFF)

    // 設定執行環境
    val conf = new SparkConf().setAppName("CustomSortBy").setMaster("local")
    val sc = new SparkContext(conf)

    //裝載資料集
    //val data = sc.textFile("F:/HDFSinputfile/customSortBy")
    val data = List((1,4),(4,8),(0,4),(12,8))
    val rdd = sc.parallelize(data)

    implicit val st = new Ordering[Int]{
      override def compare(a:Int,b:Int): Int ={
        a.toString.compare(b.toString)
      }
    }
    println("stage1")
    rdd.sortBy(x=>x._1).collect().foreach(println)

    //stage2
    //val data2 = List("a 1","a 3","a 11","b 2","c 5")//切分字串方式  自定義排序
    val data2=List(("a",1),("a",3),("a",11),("b",2),("c",5))
    val rdd2 = sc.parallelize(data2)
//    字串切分後自定義排序
//    implicit val st2 = new Ordering[String]{
//      override def compare(a:String,b:String): Int ={
//        val a1=a.split(" ")(0)
//        val a2=a.split(" ")(1).toInt
//        val b1=b.split(" ")(0)
//        val b2=b.split(" ")(1).toInt
//        if(a1==b1) a2.compare(b2)
//        else a1.compare(b1)
//      }
//    }
    //元組自定義排序
    implicit val st3 = new Ordering[(String,Int)]{
      override def compare(a:(String,Int),b:(String,Int)): Int ={
             if(a._1==b._1) a._2.compare(b._2)
             else a._1.compare(b._1)
      }
    }

    println("stage2")
    rdd2.sortBy(x=>x).collect().foreach(println)

    sc.stop()

  }

}

結果：

spark 自定義排序詳解

目的: 排序輸出資料是資料處理的常見操作，本篇部落格示例解決元組、字串按照key、value進行單值、多值自定義排序問題。程式碼 package LoadTest import org.apache.log4j.{Logger, Level} impo

angular 自定義指令詳解--restrict、restrict、replace

emp bold span 類型 ret space con 設置註意 Angularjs 允許根據實際業務需要自定義指令, 通過angular全局對象下的 directive 方法實現。可以自定義屬性、自定義標簽、自定義功能接下來定義一個名叫custom的指令，並利用

深究AngularJS——自定義服務詳解(factory、service、provider)

string targe 返回 config 屬性 doctype 三種方式啟用 print 前言 3種創建自定義服務的方式。 Factory Service Provider 大家應該知道，AngularJS是後臺人員在工作之余發明的，他主要應用了後臺早就存

angular 自定義指令詳解 Directive

聲明其他原型繼承創建 tool 兩個模板變化組合廢話不多說，下面就直接上代碼 //angular指令的定義，myDirective ，使用駝峰命名法 angular.module(‘myApp‘, []) .directive(‘myDirective‘,

AngularJs自定義指令詳解（5） - link

演示 hang cursor off drag font 雙向事件 date 在指令中操作DOM，我們需要link參數，這參數要求聲明一個函數，稱之為鏈接函數。寫法： link: function(scope, element, attrs) {　　// 在這裏操作DO

Android自定義view詳解

this boolean mar 處理都是並且 jdk text 命名從繼承開始懂點面向對象語言知識的都知道：封裝，繼承和多態，這是面向對象的三個基本特征，所以在自定義View的時候，最簡單的方法就是繼承現有的View 通過上面這段代碼，我定義了一個Ske

Android Gradle 自定義Task 詳解

png 發布我們批處理使用總結實用 shift fonts 博客轉載請標明出處：http://blog.csdn.net/zhaoyanjun6/article/details/76408024 本文出自【趙彥軍的博客】一：Gradle 是什麽 Gradl

spark自定義排序規則

package cn.edu360.day5 import org.apache.spark.rdd.RDD import org.apache.spark.{SparkConf, SparkContext} /** * Created by zx on 2017/10/10. */ o

Spring Boot 自定義日誌詳解

本節內容基於 Spring Boot 2.0. 你所需具備的基礎什麼是 Spring Boot? Spring Boot 核心配置檔案詳解 Spring Boot 開啟的 2 種方式 Spring Boot 自動配置原理、實戰 Spring Boot 2.x 啟動全過程原始碼分析

我的springboot之路(2)----springboot自定義配置詳解

一、前言我的springboot之路(1)介紹了springboot的誕生背景以及優點等，我們知道springboot簡化了程式設計配置，它體現出了一種約定優於配置，也稱作按約定程式設計，是一種軟體設計正規化，旨在減少軟體開發人員需做決定的數量，獲得簡單的好處，而又不失靈活性。一般

自定義View詳解(3)

大家教師節快樂啊，不知道勤學的Coder們有沒有去嘗試下繪製上篇文章中最後留下的進階效果，不管怎樣，還是一起動手寫一遍吧！看看套路是否一致。水波紋首先來看圖-水波紋中的效果，其具有以下特點：從內到外四層，內圓外環；從內到外四個色值；

【mui】事件管理及自定義事件詳解

1、事件繫結可以使用addEventListener()方法監聽某個特定元素上的事件外，也可以使用.on()方法實現批量元素的事件繫結。 addEventListener示例（單個元素事件繫結）： mui.plusReady(function(){ docume

spring中freemarker自定義標籤詳解

最近因工作需要，從網上搜了一個jeecms網站，準備進行借鑑使用，發現裡面對模板用的不錯，前面雖說也對freemarker有用，但是還沒有這麼深入，所以就查了一些資料，下面進行總結下。一、jar包準備首先是Spring、SpringMVC的依賴jar包…… 然後是Fr

Angular 自定義指令詳解

1.命名：可以使用普通字串，也可以使用駝峰法來命名一個指令，例如 firstDirective, 但在使用它時需要以 - 分割： first-directive。 2.建立方式： Angularjs的指令建立有四種形式，比如建立的指令hello：

Word中的自定義編號詳解及疑難彙總！

在Word中使用編號可以方便地對段落進行排序，當新增或刪除專案後，編號能自動按段落次序重新編排。本文主要給大家介紹如何自定義編號的格式，步驟如下： 1.選定要設定編號格式的段落，如果僅為一段，將插入點定位到段落中即可（如果為多個段，也可以一次

Android自定義鍵盤詳解、自定義輸入法簡介

概述 Android中有兩個系統類是用來實現鍵盤的，分別是Keyboard和KeyboardView。 Keyboard有個內部類Key，用於記錄每個鍵的資訊，如code、width、height等。而KeyBorad則持有一個List用於儲存所有Key，並

Android中通過友盟統計上傳自定義錯誤詳解

友盟統計中，其中有一個錯誤統計板塊，可以自動上傳錯誤統計，或者上傳自定義的錯誤統計，不過友盟中的這一部分，只是說了這麼幾句話，沒有詳細的說明怎麼使用 **************************************************************

Hive自定義UDAF詳解

遇到一個Hive需求：有A、B、C三列，按A列進行聚合，求出C列聚合後的最小值和最大值各自對應的B列值。這個需求用hql和內建函式也可完成，但是比較繁瑣，會解析成幾個MR進行執行，如果自定義UDAF便可只利用一個MR完成任務。所用Hive為0.13.1版本。UDAF有兩種

mysql自定義函式詳解

mysql有自己的編寫函式的語法，轉載別人的分享作為自己的參考：自定義函式 (user-defined function UDF)就是用一個象ABS() 或 CONCAT()這樣的固有（內建）函式一樣作用的新函式去擴充套件MySQL。所以UDF是對MySQL功能的一

iOS開發之模仿簡書App自定義TabBar詳解

先來看看效果圖吧然後我們再來一步一步看看程式碼 1.首先頁面下面TabBar的Button需要自定義,把Button的文字放在圖片下面 //更換文字圖片的位置，最主要的就是實現以下兩個方法，重寫父類方法 //image ratio #de

spark 自定義排序詳解

相關推薦