Spark：求出分組內的TopN

阿新 • • 發佈：2018-07-25

lac args read setprop ber rgs cas arr repl

制作測試數據源：

spark scala實現代碼：

import org.apache.spark.SparkConf
import org.apache.spark.sql.SparkSession

object GroupTopN1 {
  System.setProperty("hadoop.home.dir", "D:\\Java_Study\\hadoop-common-2.2.0-bin-master")

   
case class Rating(userId: String, rating: Long)

  def main(args: Array[String]) {
    val sparkConf = new SparkConf().setAppName("ALS with ML Pipeline")
    val spark = SparkSession
      .builder()
      .config(sparkConf)
      .master("local")
      .config("spark.sql.warehouse.dir", "/")
      .getOrCreate()
 

    import spark.implicits._
    import spark.sql

    val lines = spark.read.textFile("C:\\Users\\Administrator\\Desktop\\group.txt")
    val classScores = lines.map(line => Rating(line.split(" ")(0).toString, line.split(" ")(1).toLong))

    classScores.createOrReplaceTempView("tb_test")

    var df  
= sql(
      s"""|select
          | userId,
          | rating,
          | row_number()over(partition by userId order by rating desc) rn
          |from tb_test
          |having(rn<=3)
          |""".stripMargin)
    df.show()

    spark.stop()
  }
}

打印結果：

+------+------+---+
|userId|rating| rn|
+------+------+---+
|    c1|    85|  1|
|    c1|    66|  2|
|    c1|    65|  3|
|    c4|    65|  1|
|    c3|    95|  1|
|    c3|    88|  2|
|    c3|    54|  3|
|    c2|    91|  1|
|    c2|    77|  2|
|    c2|    66|  3|
+------+------+---+

Spark：求出分組內的TopN

lac args read setprop ber rgs cas arr repl 制作測試數據源： c1 85 c2 77 c3 88 c1 22 c1 66 c3 95 c3 54 c2 91 c2 66 c1 54 c1 65 c2 41

java常見邏輯練習題求出100內的素數個數，平切打印出當前數是什麼？（素數：只能夠被自己和1整除的數）

題目：求出100內的素數個數，平切打印出當前數是什麼？（素數：只能夠被自己和1整除的數）分析：要求100內的素數個數，我們首先要拿到1-100的所有數字，用for迴圈遍歷1-100的所有數字，即：第一步 for (int i = 1; i < 100

java常見邏輯練習題求出10內的階乘？

題目：求出10內的階乘？分析：首先要求出10內的階乘就要先將10以內的數遍歷出來，那麼我們用for迴圈遍歷即： for (int i = 1; i <= 10; i++) { } 然後我們需要明白階乘的意思是什麼，舉個例子：4的階乘為1x2x3

基礎練習：1092：求出e的值

1092：求出e的值【題目描述】利用公式e=1+11!+12!+13!+…+1n! ，求e的值，要求保留小數點後10位。【輸入】輸入只有一行，該行包含一個整數n（2≤n≤15），表示計算e時累加到1n!。【輸出】輸出只有一行，該行包含計算出來的e的值，要求列印小數點後10位。【

演算法程式設計題：求之N內的素數

題目描述用篩法求之N內的素數。輸入 N 輸出 0～N的素數樣例輸入 100 樣例輸出 2 3 5 7 11 13 17 19 23 29 31 37 41 43 47 53 59 61 67 71 73 79 83 89 97 程式設計程式碼如下：

python小練習7：求出100以內的素數

題：求出100以內所有的素數並打印出來。分析：什麼是素數？素數就是隻能被 1 和它本身所整除的數。在前面的部落格中我已經寫了，怎麼判斷一個數是否為素數。現在我來給你一種思路，就是從2~100，逐個判斷

Python：求0~100內的素數

#!/usr/bin/env python3 import math def isPrimeOrNot(number): if number < 2: return 0 elif number == 2: return 2 else: for index in range

轉：求出它是幾位數分別輸出每一位數字按逆序輸出各位數字

#include <stdio.h> int main(int argc, const char * argv[]) { /*給你一個不多於5位的正整數，要去：求出它是幾位數；分別輸出每一位數字；按逆序輸出各位數字，例如原數為:321,應

Min_25篩初級應用：求$[1,n]$內質數個數

#include <bits/stdc++.h> #define rin(i,a,b) for(int i=(a);i<=(b);++i) #define irin(i,a,b) for(int i=(a);i>=(a);--i) #define trav(i,a) for(int i

Spark：Java實現分組取Top N

1、源資料如下，取出每班成績的前三名 class1 98 class2 90 class2 92 class1 96 class1 100 class2 89 class2 68 class1 81 class2 90 2.實現程式碼 package c

特殊迴文數字：求出5位數和6位數中各位上的數字之和為n的迴文數。

問題描述　　123321是一個非常特殊的數，它從左邊讀和從右邊讀是一樣的。　　輸入一個正整數n，程式設計求所有這樣的五位和六位十進位制數，滿足各位數字之和等於n 。輸入格式　　輸入一行，包含一個正整數n。輸出格式　　按從小到大的順序輸出滿足條件的整數，每個整

spark項目啟動報內存溢出不能創建線程錯誤

def span 占用 nbsp ssp 數據 mes 線程數 listen 1.錯誤信息如下： java.lang.OutOfMemoryError: unable to create new native thread at java.lang.Thread.st

SQL：某個時間段範圍內，產品有價格，且求平均數

having end case 產品天數 logs style where and select ID,AVG(fPrice) as avgPrice from Price where Hp_Date >=‘2017-07-04‘ and Hp_Dat

從原理上理解如何由震源機制一個節面的解：strike,dip,rake可以求出另一個節面的解

方向矢量不難角度 image 技術 log 表達分享首先，需要回到最原始的地震矩的表達式：已知strike,dip,rake 根據strike和dip可以求出v,根據strike,dip,rake,可以求出u。把求出來的v和u互換，相當於原來的位錯矢量變成法

課堂測試：輸入整數，求出各位數字的和

option system dia int 整數 != tdi n) .cn import javax.swing.JOptionPane;public class Add { public static void main(String[] args) { Str

編寫一個程序，求出200到300之間的數，且滿足條件：它們三個數字之積為42，三個數字之和為12

clas system print gpo 變量輸出滿足定義 post //定義變量ge、shi、bai，用於存放個位、十位、百位上的數字 int number=0; //使用for循環 for(nu

案例七：輸入一名學生的姓名和他的5門課成績，求出平均分並顯示。

成績 oid spa inf double project 平均值 ann 學生 package project_07; import java.util.Scanner; /** * 2018年9月7日22:52:49 * @author Suaron XiaM

JAVA——求出指定範圍內所有的質數

求出指定範圍內所有的質數 1.要求在視窗輸出指定範圍內所有的質數，並對所有輸出的質數個數進行計數。 2.質數在所有比1大的整數中,除了1和它本身以外,不再有別的因數,這種整數叫做質數或素數。還可以說成質數只有1和它本身兩個約數。 3.原理具體做法是：先

java實現：2018年9月9日晚上的京東筆試題：現給出n個物品的a,b,c引數，請你求出不合格品的數量。

題目：現有n個物品，每個物品有三個引數，ai,bi,ci,定義i物品不合格的依據是：若存在物品j,且aj>ai,bj>bi,cj>ci，則稱i物品為不合格品。現給出n個物品的a,b,c引數，請你求出不合格品的數量。輸入：第一行包含一個整數n(1<=n&

spark分組取topN

準備資料： aa 11 bb 11 cc 34 aa 22 bb 67 cc 29 aa 36 bb 33 cc 30 aa 42 bb 44 cc 49 import org.apache.spark.{SparkConf, SparkContext} /** * @author

Spark：求出分組內的TopN

制作測試數據源：

spark scala實現代碼：

相關推薦