spark求共同好友

阿新 • • 發佈：2018-11-29

使用spark求共同好友：

在做一些專案時，又時可能遇到一些類似與求共同好友的要求，可以根據共同好友進行推薦新增好友，就比如說A和B的好友有M,K,O,L，那麼有可能A和B就是也認識，所以可以把B推薦給A，下面是用Spark求共同好友的實現

資料格式如下
A:B,D,E,H,I,O
B:A,C,E,K
C:F,A,D,I
D:A,E,F,L
E:B,C,D,M,L
F:B,C,D,E,O,M

在這裡插入圖片描述


import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext} 


object CommFriend {
  def main(args: Array[String]): Unit = {
    var Array(inputPath,outputPath) = args
    inputPath = "D:\\tools\\qianfeng\\hadoop\\Mapreduce\\day09Mapreduce\\fr.txt"
    val conf = new SparkConf().setAppName(s"${this.getClass.getName}").setMaster("local")
    val sc = new SparkContext 
(conf)
    val lines = sc.textFile(inputPath)
    val friendAndPerson: RDD[(String, List[String])] = lines.flatMap(m => {
      val sp = m.split(":")
      val str: String = sp(0)
      val sp1= sp(1).split(",")
      val tuples: Array[(String, List[String])] = sp1.map(t => {
        //val t: String = t 

        //一個好友對應一個人
        (t,List(str))
      })
      tuples
    })
  


    //(friend,persons)  把好友相同的人進行聚合
    val friAndPers: RDD[(String, List[String])] = friendAndPerson.reduceByKey((list1, list2) => {
      list1 ::: list2
    })
   
    //每兩個人之間的共同好友
    val ppAndcomFri: RDD[(String, String)] = friAndPers.flatMap(t => {
      val sortedFriend: List[String] = t._2.sortBy(x => x) //這樣可以避免重複出現 A-B 的好友是C ,和 B-A 的好友是C一樣
      val friend: String = t._1 //共同好友
      var commFriends: List[(String, String)] = List[(String, String)]()
      for (i <- 0 until sortedFriend.length) {  //自己和自己不能是好友，且不能重複
        /*
        E  List（A, B ,C） ABC 都有共同好友是E,可以得到 （A-B，E）（A-C，E）（B-C，E）
        對於 B List(N) 代表 只有N有好友B,所以這種就被滿足迴圈條件
         */
        for (j <- i + 1 until sortedFriend.length) {
          //誰跟誰是共同好友（xx-nn,mm） xx 和 nn 的共同好友是 mm
          val tuple: (String, String) = (sortedFriend(i) + "-" + sortedFriend(j), friend)
          commFriends = commFriends ::: List(tuple)
        }
      }
      commFriends
    })

  
    // a-b 的共同好友有n m d h f 。。。
    val gbk: RDD[(String, Iterable[String])] = ppAndcomFri.groupByKey()
    println(gbk)
    gbk.map(m=>{
      (m._1, m._2.mkString(","))
    })
    .coalesce(1).saveAsTextFile(outputPath)

  }

}

spark求共同好友

使用spark求共同好友：在做一些專案時，又時可能遇到一些類似與求共同好友的要求，可以根據共同好友進行推薦新增好友，就比如說A和B的好友有M,K,O,L，那麼有可能A和B就是也認識，所以可以把B推薦給A，下面是用Spark求共同好友的實現資料格式如下 A:B

hadoop求共同好友一個MapReduce搞定

Map端 package com.yd.CommFriend; import java.io.IOException; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import

求共同好友，多job運用

package bd1805day09; import java.io.IOException; import java.net.URI; import java.net.URISyntaxException; import org.apache.hadoop.conf.Configur

BigData_A_A_03-YARN-資源管理和任務排程（2）共同好友(spark)

楔子最近看了hadoop求共同好友，也瞭解一些spark基本程式設計，感覺思路一致，可以試試spark demo 是否是直接好友,因為存在這種情況，他倆是直接好友，但是他倆同時也是別人的間接好友，這種情況排除,因此兩次flatMap,第二次就是為了排除第一

大數據技術之找博客共同好友案例

image mapred top 代碼 jar split set 代碼實現 port 7.9 找博客共同好友案例 1）需求：以下是博客的好友列表數據，冒號前是一個用戶，冒號後是該用戶的所有好友（數據中的好友關系是單向的） A:B,C,D,F,E,O B

redis系列：通過共同好友案例學習set命令

val 執行其他命令 vat system 得到 hash src per 前言這一篇文章將講述Redis中的set類型命令，同樣也是通過demo來講述，其他部分這裏就不在贅述了。項目Github地址：https://github.com/rainbowda/lear

spark 求相鄰的元素有多少個？

資料：資料 A;B;C;D;B;D;C B;D;A;E;D;C A;B 如上面的資料，A,B有兩個 C,D有一個 D,C有兩個 /* A;B;C;D;B;D;C B;D;A;E;D;C A;B */ object De

mapreduce-找出共同好友

1、原始資料 A:B,C,D,E,O B:A,C,E,K C:F,A,D,I D:A,E,F,L E:B,C,D,M,L F:A,B,C,D,E,O,M G:A,C,D,E,F H:A,C,D,E,O I:A,O J:B,O K:A,C,D L:D,E,F M:E,F,G O:A,H,I

MapReduce找共同好友

用到的資料建立一個txt檔案放進去就可以啦 A:B,D,E,H,I,O B:A,C,E,K C:F,A,D,I D:A,E,F,L E:B,C,D,M,L F:B,C,D,E,O,M G:Q,W,A,C,E,O H:A,C,E,D,O I:A,O J:B,P K:A,C,D L:D,E,

MapReduce 找出共同好友

方式之間好友 mapr 思考個人 nbsp 代碼 pre 這個前提需要註意：好友之間的關系是單向的，我的好友隊列裏有你，你的裏面不一定有我。所以思考方式需要改變。共同好友：某兩個人的好友隊列裏都有的人。第一個mapper 和 reducer 簡單說：找出

用Redis存取兩個人的共同好友名單

首先，我們要查出兩個人是否是好友關係（互關狀態）我們可以用Redis 的set 存set user：1：funs 值（set是無序不可重複的） user:1:fans [2,3,4] //關注使用者1的粉絲 user:1:follows [2,5,7,8] //使

MapReduce尋找共同好友

初始資料 A:B,C,D,F,E,O B:A,C,E,K C:F,A,D,I D:A,E,F,L E:B,C,D,M,L F:A,B,C,D,E,O,M G:A,C,D,E,F H:A,C,D,E,O I:A,O J:B,O K:A,C,D L:D,E,F M:E,F,G

hadoop入門6：hadoop查詢兩兩之間有共同好友，及他倆的共同好友都是誰

A:B,C,D,F,E,O B:A,C,E,K C:F,A,D,I D:A,E,F,L E:B,C,D,M,L F:A,B,C,D,E,O,M G:A,C,D,E,F H:A,C,D,E,O I:A,O J:B,O K:A,C,D L:D,E,F M:E,F,G O:A,H,

spark求最受歡迎的老師的問題

檔案內容： http://bigdata.edu360.cn/zhangsan http://bigdata.edu360.cn/zhangsan http://bigdata.edu360.cn/lisi http://bigdata.edu360.cn/lisi 1.求最受歡迎的老師,不

BigData_A_A_03-YARN-資源管理和任務排程（2）共同好友(hadoop)

楔子 hadoop 統計共同好友 demo 思路是兩次遍歷，按照他倆是不是直接好友，如果是直接好友，輸出 key(friendA + “:” + friendB) value(0) 如果他倆是同一個人的好友輸出 key(friendA + “:”

MapReduce簡單實踐：兩步實現查詢共同好友

問題需求：現在有某社交網路中的記錄每個使用者的好友的資料集，資料的具體格式如下所示，冒號前為使用者的代號，冒號後面為該使用者的好友的代號，好友之間以逗號分隔。現在需求是根據此資料集，求出任意兩個人之間的共同好友都有誰（好友關係是單向的，也就是說A的好友裡面有E，

Spark實現之好友推薦

網上好多好推薦之類的部落格都是基於二度好友的推薦，下面介紹基於鄰接表的好友推薦的spark實現。輸入： 1 2,3,4,5,6,7,8 2 1,3,4,5,7 3 1,2 4 1,2,6 5 1,2 6

MapReduce實現尋找共同好友

public class SharedFriend { /* 第一階段的map函式主要完成以下任務 1.遍歷原始檔案中每行<所有朋友>資訊 2.遍歷“朋友”集合，以每個“朋友”為鍵，原來的“人”為值即輸出<朋友,人> */ static class Shared

共同好友（java）

查詢兩個使用者的共同好友（例如兩個QQ使用者）例如有兩個使用者，他們分別有一個好友集，user1friends和user2friends，分別放到set集合中 import java.util.Set; import java.util.TreeSet

Spark求資料集中同一主鍵記錄中的最新資料

/** * 測試資料：* 1,001,10,2015-10-29 * 1,001,8.9,2015-10-28 * 2,002,5,2015-10-27 * 2,002,3,2015-10-28 * 3,003,5.9,2015-11-03 * */object Remov

spark求共同好友

相關推薦