spark1.x和2.xIterable和iterator兼容問題

阿新 • • 發佈：2018-11-19

環境兼容 lean 進行 java spark1.x pair map row

1. spark 1.x 升級到spark 2.x
對於普通的spark來說,變動不大 :
1
舉一個最簡單的實例:

spark1.x
public static JavaRDD<String> workJob(JavaRDD<String> spark1Rdd) {

        JavaPairRDD<String, Integer> testRdd = spark1Rdd
                .flatMapToPair(new PairFlatMapFunction<String, String, Integer>() {

            @Override
            public Iterable<Tuple2<String, Integer>> call(String str)
                    throws Exception {
                ArrayList<Tuple2<String, Integer>> list = new ArrayList<>();
                return list;


            }
        });

        return spark1Rdd;
    }
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
spark2.x
public static JavaRDD<String> workJob(JavaRDD<String> spark2Rdd) {

        JavaPairRDD<String, Integer> testRdd2 = spark2Rdd
                .flatMapToPair(new PairFlatMapFunction<String, String, Integer>() {

            @Override
            public Iterator<Tuple2<String, Integer>> call(String str)
                    throws Exception {
                ArrayList<Tuple2<String, Integer>> list = new ArrayList<>();


                return list.iterator();
            }
        });

        return spark2Rdd;
    }
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
需要說明的是: 
上面的返回的rdd就直接用輸入的 RDD顯然是不合理的! 只是為了用最簡潔的方式介紹代碼的轉換而已!

可以看到 : 區別主要在於
1. spark 1.x中的Iterable對象 變成了 spark2.x中的Iterator對象
2. 相應的,對於返回值為list的RDD,  spark2.x中要返回list.iterator();
1
2
3
還是很簡單的吧

問題在於 : 如果你有幾個spark程序要運行在不同的環境下,(有的現場用1.x,有的現場用2.x) 
你需要同時維護兩種不同版本的spark,是不是耗時又耗力呢?

這個時候就需要考慮到 spark版本的兼容性,使你的程序能成功的運行在各種集群環境下

2. spark版本的兼容
寫一個簡單的工具類如下 :

import java.util.Iterator;

public class MyIterator<T> implements Iterator, Iterable 
{
    private Iterator myIterable;

    public MyIterator(Iterable iterable)
    {
        myIterable = iterable.iterator();
    }

    @Override
    public boolean hasNext() 
    {
        return myIterable.hasNext();
    }

    @Override
    public Object next() 
    {
        return myIterable.next();
    }

    @Override
    public void remove() 
    {
        myIterable.remove();
    }

    @Override
    public Iterator iterator() 
    {
        return myIterable;
    }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
只需要進行如上設計就可以實現版本的兼容了 
那麽應該如何應用呢?

 JavaRDD<String> flatMapRDD = lines.flatMap(new FlatMapFunction<String, String>() {
            @Override
            public MyIterator<String> call(String s) throws Exception {
                String[] split = s.split("\\s+");
                MyIterator myIterator = new MyIterator(Arrays.asList(split));
                return myIterator;
            }
});

環境兼容 lean 進行 java spark1.x pair map row 1. spark 1.x 升級到spark 2.x 對於普通的spark來說,變動不大 : 1 舉一個最簡單的實例: spark1.x public static JavaRDD<S

spark1.x和2.xIterable和iterator相容問題

1. spark 1.x 升級到spark 2.x 對於普通的spark來說,變動不大 : 1 舉一個最簡單的例項: spark1.x public static JavaRDD<String> workJob(JavaRDD<String> spark1Rdd) {

關於前端Retina 屏幕兼容和基於Retina 屏幕兼容的雪碧圖技巧

com 兩張 include 很好做的 log 項目 only alt 由於蘋果電腦的普及，所以Retina 屏幕兼容越來越重要，在普通屏幕上正常的背景，在Retina 屏幕上都會發虛。首先新建一個scss文件，起名為utils.scss ,在文件中寫入下面代碼： /*

Date.parse和new Date(str)的兼容性問題

parse lan zh-cn class detail java devel global 兼容性 Date.parse和new Date(str)的兼容性問題 Date ‘2015-05-04‘是無法被各個瀏覽器中，使用new Date(str)來正確生成日期對

【Selenium-WebDriver問題點】driver和瀏覽器版本之間的兼容性問題

鏈接 server ast HP 瀏覽器 releases html tar window 今天把手頭有的一些關於selenium測試的資源整理了一下，分享出來。 1. 所有版本chrome下載是不是很難找到老版本的chrome？博主收集了幾個下載chrome老版本的網站

當同時安裝Python2和Python3後，如何兼容並切換使用詳解（比如pip使用）

err 完美解決執行文件 class 需要提示改名 launcher 順序查找由於歷史原因，Python有兩個大的版本分支，Python2和Python3，又由於一些庫只支持某個版本分支，所以需要在電腦上同時安裝Python2和Python3，因此如何讓兩個版

jQuery3.2.1 和2.0和 1區別

1. 移除舊的IE工作區新的最終版最主要的目標是更加快速，更加時尚，因此，那些支援早於IE9版本的相關技術與工作區都被移除了。這意味著如果你想要或者需要支援IE6-8，你必須用回1.12版本，因為甚至是2.X版本都無法完整支援早於IE9的瀏覽器。注意：在jQuery 3中還

總結apache2.2和2.4和tomcat負載均衡配置和總結。

apache負載均衡有3種方式，本人只搭配了兩種方式一.mok_jk方式(目前這個方式只配置成功2.2版本，2.4未配置。) 1.apache2.2配置準備工作 1.1下載安裝包httpd-2.2.22-win32-x86-no_ssl.msi 1.11下載後安裝到指定資

Spring boot和Spring cloud對應版本兼容問題

通過 org als 3.x 使用 The 2.0 uil 引入 Spring boot和Spring cloud對應版本兼容問題最近要搭建一個網關系統，使用到了Spring cloud，在引入對應的依賴後，啟動時報錯org.springframework.boot.b

CentOS 7.2 安裝python3.6,兼容原有的2.7

centos7 python3很早以前就想著要寫博客,因為做了很多事情,總是記不住,能寫下來,就當是日記了.我這次想要在我的centos7裏面安裝python3.6,並且能與原來的2.7兼容.1、查看原來的python版本[root@python ~]# pythonPython 2.7.5 (default

Go 語言的下一個大版本：Go 2.0 被安排上了（全面兼容1.X，改進錯誤處理和泛型這兩大主題）

.org leader utf8 驅動 cleanup 周期一份早期下一個今年 8 月 Go 開發團隊公布了 Go 2.0 的設計草案，包括錯誤處理和泛型這兩大主題。現在備受矚目的 Go 2.0 又有了新動向 —— 昨日 Go 開發團隊在其官

Spark1.x和2.x如何讀取和寫入csv檔案

看很多資料，很少有講怎麼去操作讀寫csv檔案的，我也查了一些。很多部落格都是很老的方法，還有好多轉來轉去的，複製貼上都不能看。下面我在這裡歸納一下，以免以後用到時再費時間去查通過sc.textFile val input = sc.textFile("test.csv") val result = i

Spark1.x和2.x如何讀取和寫入csv文件

方法 csv del 標準分隔符 sql ORC 表示 create 看很多資料，很少有講怎麽去操作讀寫csv文件的，我也查了一些。很多博客都是很老的方法，還有好多轉來轉去的，復制粘貼都不能看。下面我在這裏歸納一下，以免以後用到時再費時間去查通過sc.textFile

寫一個帶文本菜單的程序,菜單項如下 (1) 取五個數的和 (2) 取五個數的平均值 (X) 退出。

highlight 五個 div true while blog inpu input 重新問題：寫一個帶文本菜單的程序,菜單項如下(1) 取五個數的和 (2) 取五個數的平均值(X) 退出。由用戶做一個選擇, 然後執行相應的功能。當用戶選擇退出時程

Spring Boot 1.X和2.X優雅彩38平臺出租重啟實戰

main pau ble eas ren 超過 kill -9 tst 兼容項目在彩38平臺出租 haozbbs.com Q1446595067 重新發布的過程中，如果有的請求時間比較長，還沒執行完成，此時重啟的話就會導致請求中斷，影響業務功能，優雅重啟可以保證在停止的時

const的使用和lES6的兼容處理|-ES6連載2

是你一個當前 red 編程友誼 module 提示界面大家好，好久不見，經過上次ES6的介紹和let聲明後，小編繼續給大夥帶來更精彩的ES6。關鍵字const 的作用 const是constant（常量）的縮寫，const和 let一樣，也是用來聲明變量的，但是

ELK6.2.3日誌分析工具elasticsearch x-pack6.2.3許可權管理Security模組和內建角色介紹

啟動elasticsearch 1.自定義設定密碼，三個內建賬號根據提示設定密碼 ./bin/x-pack/setup-passwords interactive 2.自動生成密碼 ./bin/x-pack/setup-passwords auto 3.在kibana通過DSL語句設定密碼

【圖文詳細】HDFS面試題：hadoop1.x和2.x架構上的區別

（1）Hadoop 1.0 Hadoop 1.0即第一代Hadoop，由分散式儲存系統HDFS和分散式計算框架MapReduce組成，其中，HDFS由一個NameNode和多個DataNode組成，MapReduce由一個JobTracker和多個TaskTracker組成，對應Hadoop

spring boot 2.X整合spring security和spring oauth

網上有很多該系列的教程，但是很多都是spring boot1.x,很少看見關於spring boot 2.0 .本人是打算做個spring cloud的web程式,這個整合我就是放在zuul上，類似於做了個閘道器的鑑權吧。。國際通用案例

xutils 2.x（2.6）中的session獲得和cookieStore使用

package com.lidroid.xutils; import android.text.TextUtils; import com.lidroid.xutils.exception.HttpException; import com.lidroid.xutils.http.*; import com

spark1.x和2.xIterable和iterator兼容問題

相關推薦