用Apache Spark進行大資料處理之用Spark GraphX圖資料分析（6）

阿新 • • 發佈：2019-01-29

import org.apache.spark._
import org.apache.spark.graphx._
import org.apache.spark.rdd.RDD
import java.util.Calendar

// 先匯入邊
val graph = GraphLoader.edgeListFile(sc, "data/page-rank-yt-data.txt")

// 計算圖中邊和節點等資訊

val vertexCount = graph.numVertices

val vertices = graph.vertices
vertices.count()

val edgeCount = graph.numEdges

val edges = graph.edges
edges.count()

//
// 現在來看看某些Spark GraphX API，如triplets、indegrees和outdegrees。
//
val triplets = graph.triplets
triplets.count()
triplets.take(5)

val inDegrees = graph.inDegrees
inDegrees.collect()

val outDegrees = graph.outDegrees
outDegrees.collect()

val degrees = graph.degrees
degrees.collect()

// 用迭代次數作為引數
val staticPageRank = graph.staticPageRank(10)
staticPageRank.vertices.collect()

Calendar.getInstance().getTime()
val pageRank = graph.pageRank(0.001).vertices
Calendar.getInstance().getTime()

// 輸出結果中前5個元素
println(pageRank.top(5).mkString("\n"))

用Apache Spark進行大資料處理之用Spark GraphX圖資料分析（6）

import org.apache.spark._ import org.apache.spark.graphx._ import org.apache.spark.rdd.RDD import java.util.Calendar // 先匯入邊 val graph = GraphLoader.edgeL

大資料處理之——簡明Spark介紹

很多涉及或者並行式機器學習工作或者大資料處理的崗位，基本都會有要求會使用Hadoop/Hive/Spark/Storm這幾個開源工具，那麼針對其中比較主流的Spark，我在這裡做一個比較簡單地總結。什麼是Spark？在技術不斷告訴更迭的程式

Python海量資料處理之_Hadoop&Spark

1. 說明前篇介紹了安裝和使用Hadoop，本篇將介紹Hadoop+Spark的安裝配置及如何用Python呼叫Spark。當資料以TB,PB計量時，用單機處理資料變得非常困難，於是使用Hadoop建立計算叢集處理海量資料，Hadoop分為兩部分，一部分是資料儲存HDFS，另一部分是資料計算MapR

大資料系列之分散式釋出訂閱訊息系統Kafka（一）Kafka簡介，組成，叢集安裝

1.Kafka簡介 Kafka如同JMS(Java Message Service)一樣，是一箇中間件，在異構系統間通訊，為不同的系統之間提供服務。我們知道JMS通過佇列（一對一）與主題（一對多）兩種形式提供服務，而Kafka則通過主題（topic），來給一組消費者提供

大資料系列之分散式釋出訂閱訊息系統Kafka（四）Kafka與Flume的3種整合

前面我們已經介紹了Flume，現在我們將Kafka與Flume整合先看一下Flume的結構組成：我們可以發現，將Flume與Kafka進行整合無非3種情況，Flume作為生產者——Sink輸出到Kafka，Flume作為消費者——Source接

zigbee 之ZStack-2.5.1a原始碼分析（三）無線資料傳送和接收

前面說過SampleApp_Init和SampleApp_ProcessEvent是我們重點關注的函式，接下來分析無線傳送和接收相關的程式碼：在SampleApp_ProcessEvent函式中： if ( events & SYS_EVENT_MSG ) { &nbs

資料結構之基本查詢與樹表查詢（上）

只要你開啟電腦，就會涉及到查詢技術。如炒股軟體中查股票資訊、硬碟檔案中找照片、在光碟中搜DVD，甚至玩遊戲時在記憶體中查詢攻擊力、魅力值等資料修改用來作弊等，都要涉及到查詢。當然，在網際網路上查詢資訊就更加是家常便飯。查詢是計算機應用中最常用的操作之一，也是許多程

數字影象處理之二維碼影象提取演算法（二）

二維碼標準：國外：pdf417，Datamatrix，QR 國內：龍貝，漢信。影象輸入-> 影象預處理-> 二維碼影象切割（定位）-> 二維碼影象校正-> 譯碼譯碼：二維碼碼字提取-> 糾錯譯碼-> 資訊譯碼糾錯譯碼：求解伴隨因

Python資料型別之數值－Python基礎前傳（5）

學習任何一門學科或者手藝，最忌諱的就是想的太多，做的太少；有很多朋友私信問我：jacky,我們該如何選擇Python的課程？或是我們該如何選擇Mysql課程？到底誰的課件和書籍才是最好的？

資料結構之自平衡二叉查詢樹（1）

今天開始，我們再來認識一個新的二叉樹，稱為自平衡二叉查詢樹。AVL樹是最先發明的自平衡二叉查詢樹。 AVL樹的特點是：對於樹中的任何節點，節點的左右子樹的高度差距最大為1，所以AVL樹也稱為高度平衡樹。AVL樹得名於它的發明者G.M. Adelson-Velsky和E.M.

linux設備驅動之misc驅動框架源碼分析（一）

linux驅動開發misc設備驅動 1、misc設備驅動框架源碼部分是由內核開發者實現提供的，主要是創建misc類和為驅動開發者提供misc_register函數，來進行創建misc設備。這部分的源碼在/drvier/char/misc.c裏，代碼如下：/* * linux/drivers/c

linux設備驅動之misc驅動框架源碼分析（二）

linux驅動開發misc設備驅動1、misc_open函數分析該函數在driver/char/misc.c中，misc.c是驅動框架實現的，這裏面的misc_Open函數是misc驅動框架為應用層提供的一個打開misc設備的一個接口。 1、首先我們要知道在misc.c中的misc_init函數

zigbee 之ZStack-2.5.1a原始碼分析（二）無線接收控制LED

本文描述ZStack-2.5.1a 模板及無線接收移植相關內容。 main HAL_BOARD_INIT // HAL_TURN_OFF_LED1 InitBoard HalDriverInit HalAdcInit

zigbee 之ZStack-2.5.1a原始碼分析（一）

先看main，在檔案Zmain.c裡面 main osal_init_system(); osalInitTasks(); ... ... SampleApp_Init( taskID ); // 使用者定義的任務

python資料探勘實戰筆記——文字分析（6）：關鍵詞提取

緊接上篇的文件，這節學習關鍵字的提取，關鍵詞——keyword，是人們快速瞭解文件內容，把握主題的重要內容。 #匯入需要的模組 import os import codecs import pandas import jieba import jieba.ana

Java之品優購課程講義_day11（6）

.更新索引庫 7.1 需求分析在進行商品稽核後更新到 solr 索引庫,在商品刪除後刪除 solr 索引庫中相應的記錄. 7.2 查詢稽核商品（SKU）列表 7.2.1 服務介面層修改 pinyougou-sellergoods-interface 的 GoodsServ

Java之品優購課程講義_day16（6）

.1.1 跳板頁（1）建立跳板頁：pinyougou-cart-web 工程新建 login.html ,頁面新增指令碼 <script type="text/javascript"> location.href="cart.html"; </scri

springcloud feign原始碼分析（6）——關鍵元件！找一找Feign.Client用的是誰以及居然在這裡就跟ribbon關聯了！

分析完了底層的原始碼，就是用各種預設的bean、配置的bean、配置的引數，構造了一個Feign.Builder，接下來就是基於這個Feign.Builder，還得在這個Builder裡放一個Feign.Client進去。。。如果你在@FeignClient上，沒有配置u

Java之品優購課程講義_day19（6）

品優購-秒殺下單 4.1 需求分析商品詳細頁點選立即搶購實現秒殺下單，下單時扣減庫存。當庫存為 0 或不在活動期範圍內時無法秒殺。 4.2 後端程式碼 4.2.1 服務介面層修改 pinyougou-seckill-interface 的 SeckillOrd

Java多執行緒之Condition實現原理和原始碼分析（四）

章節概覽、 1、概述上面的幾個章節我們基於lock(),unlock()方法為入口，深入分析了獨佔鎖的獲取和釋放。這個章節我們在此基礎上，進一步分析AQS是如何實現await，signal功能。其功能上和synchronize的wait，notify一樣。

用Apache Spark進行大資料處理之用Spark GraphX圖資料分析（6）

相關推薦