《深入理解Spark》Spark自定義分割槽器

阿新 • • 發佈：2019-02-19

package com.lyzx.reviewDay27

import org.apache.spark.{Partitioner, SparkConf, SparkContext}

class T1 {
  /**
    * Spark自定義分割槽器
    * @param sc
    */
  def f1(sc:SparkContext):Unit ={
    val rdd = sc.parallelize(List(99,88,200,10,900,1000),2).map(x=>(x,x))

    rdd.mapPartitionsWithIndex((index,itr)=>{
      println("index:"+index)
      while(itr.hasNext){
        print("-"+itr.next())
      }
      itr
    }).collect()

    val partRdd = rdd.partitionBy(new MyPartitioner)
    partRdd.mapPartitionsWithIndex((index,itr)=>{
      println("index:"+index)
      while(itr.hasNext){
        print("="+itr.next())
      }
      itr
    }).collect()
  }
}


class MyPartitioner extends Partitioner{
  //分割槽的個數
  override def numPartitions: Int = 2

  /**
    * 獲取分割槽的編號
    * @param key
    *      RDD所對映的鍵值對資料的鍵
    * @return
    *     分割槽編號:如果返回1就是第二個分割槽
    */
  override def getPartition(key: Any): Int = {
    val k = key.toString.toInt
    if(k > 100){
      return 1
    }else{
      return 0
    }
  }
}
object T1{
  def main(args: Array[String]): Unit = {
    val conf  = new SparkConf().setAppName("reviewDay27").setMaster("local")
    val sc = new SparkContext(conf)
    val t= new T1
    t.f1(sc)

    sc.stop()
  }
}

《深入理解Spark》之通過自定義分割槽器解決資料傾斜問題

package com.lyzx.day37 import org.apache.spark.{Partitioner, SparkConf, SparkContext} class D1 { //partitionBy和自定義分割槽器解決資料傾斜的問題 def

《深入理解Spark》Spark自定義分割槽器

package com.lyzx.reviewDay27 import org.apache.spark.{Partitioner, SparkConf, SparkContext} class

MR之partition自定義分割槽器

maptask執行的結果都會放到一個分割槽檔案中，這個分割槽檔案有自己的編號，這個編號是通過一個hash演算法來生成的，通過對context.write(k,v)中的k進行hash會產生一個值，相同的key產生的值是一樣的，所以這種辦法能將相同的key值放到一個分割槽中。分割槽中的值會發送給

MapReduce之自定義分割槽器Partitioner

@[toc] ## 問題引出 >要求將統計結果按照條件輸出到不同檔案中（分割槽）。比如：將統計結果按照**手機歸屬地不同省份**輸出到不同檔案中（分割槽） ## 預設Partitioner分割槽 ```java public class HashPartitioner extends Partitio

類的學習筆記（3）——自定義裝飾器及裝飾器的理解

例一：實現多加100 def fun1(x): def fun2(y): return x(y)+100 return fun2 #裝飾器 def ff(y): return y*y

在struts2中配置自定義攔截器放行多個方法

return med ttr limit ring req tac cat invoke 源碼：自定義的攔截器類： //自定義攔截器類:LoginInterceptor ; package com.java.action.interceptor; import j

SpringMVC 自定義轉換器

del 轉化 string sna 問題 print request package type 實踐SpringMVC轉化器是遇到的問題：表單提交沒有經過自定義轉換器（解決：表單用post方式提交）自定義轉化器代碼 package cn.liangqinghai.

JAVAEE——struts2_04：自定義攔截器、struts2標簽、登陸功能和校驗登陸攔截器的實現

strac htm logs transacti 標識 area 返回 ftw jsp 一、自定義攔截器　　1.架構　　　　2.攔截器創建 //攔截器:第一種創建方式 //攔截器生命周期:隨項目的啟動而創建,隨項目關閉而銷毀 public class MyInt

struts2學習(6)自定義攔截器-登錄驗證攔截器

back tps class res urn fff .com space war 需求：對登錄進行驗證，用戶名cy 密碼123456才能登錄進去；　登錄進去後，將用戶存在session中；其他鏈接要來訪問(除了登錄鏈接),首先驗證

手機影音第六天自定義播放器頁面的實現（按鈕暫時未監聽）

手機影音第六天自定義播放器布局以及橫豎屏切換播放器時的問題解決目前進度的項目源代碼托管在裏碼雲上，地址如下： https://git.oschina.net/joy_yuan/MobilePlayer 感興趣的可以去下載看看，多多支持

深入理解JVM：垃圾收集器與內存分配策略

四種內存回收第一次不可達 append test 方法 static hot 堆裏面存放著Java世界差點兒全部的對象實例，垃圾收集器在對堆進行回收前。第一件事情就是要確定這些對象之中哪些還存活，哪些已經死去。推斷對象的生命周期是否結束有下面幾種方

自定義攔截器判斷用戶是否有權限訪問

indexof mon com source ora extend ide isa att 1、關於權限系統，對於用戶是否有權限對系統進行訪問，設置自定義攔截器，來攔截用戶的請求 1 package org.slsale.interceptor; 2 3 impo

使用html5中video自定義播放器必備知識點總結以及JS全屏API介紹

標簽 quest htm round internet tel ren per 全屏一、video的js知識點： controls(控制器)、autoplay(自動播放)、loop(循環)==video默認的；自定義播放器中一些JS中提供的方法和屬性的記錄： 1、pla

自定義比較器CustomComparator

mco oid port for list str new com public package com.list; import java.util.ArrayList; import java.util.Comparator; import java.util.Li

spring boot框架學習8-【幹貨】spring boot的web開發(4)-自定義攔截器處理權限

凱哥spring boot spring boot框架本章節主要內容：通過前面的學習，我們了解並快速完成了spring boot第一個應用。spring boot企業級框架，那麽spring boot怎麽讀取靜態資源？如js文件夾，css文件以及png/jpg圖片呢？怎麽自定義消息轉換器呢？怎麽自定

創建一個自定義比較器

rac void ger 接口 table string pre ride com 雙列集合： -------------| Map 如果是實現了Map接口的集合類，具備的特點：存儲的數據都是以鍵值對的形式存在的，鍵不可重復，值可以重復。 ---------------

轉：深入理解Java G1垃圾收集器

線程數 hot 原因重要特性賦值圖標參數堆內存 java垃圾收集器的歷史第一階段，Serial（串行）收集器在jdk1.3.1之前，java虛擬機僅僅能使用Serial收集器。 Serial收集器是一個單線程的收集器，但它的“單線程”的意義並不僅僅是說明它只

深入理解Java類加載器(1)：Java類加載原理解析

排查中比失敗 bootstrap class 信息 dex jvm java類轉自:http://blog.csdn.net/zhoudaxia/article/details/35824249 1 基本信息　　每個開發人員對java.lang.ClassNot

【第四十章】Spring Boot 自定義攔截器

ram obj pre .config factor ati bean configure 邏輯 1.首先編寫攔截器代碼 package com.sarnath.interceptor; import javax.servlet.http.HttpServlet

深入理解Java類加載器(2)

同時例如 char account 而且 request 系統屬性 launch write 1 基本信息　　每個開發人員對Java.lang.ClassNotFoundExcetpion這個異常肯定都不陌生，這背後就涉及到了java技術體系中的類加載。Java

《深入理解Spark》Spark自定義分割槽器

相關推薦