Spark

Java微服務:用Spark替代SpringBoot才是正確的方式

一個真正的微服務是一個非常輕薄的程式,只有一個函式具有自己的資料庫(如果有必要)和非常小的記憶體佔用......在Java中可能嗎? 問題 我已經使用Spring Framework多年了,

Spark 運算元講解(action 篇)

spark運算元分為兩大種,一種是 transformation運算元,另一種是 action運算元。 transformation又叫轉換運算元,它從一個 RDD

Spark 持續流處理和微批處理的對比

Spark從2.3版本開始引入了持續流式處理模型,可將流處理延遲降低至毫秒級別,讓 Structured Streaming 達到了一個里程碑式的高度。 下面的架構圖中,既有微批處理,還有持續流處理,兩種模

使用 Spark 輕鬆做資料透視(Pivot)

spark從1.6開始引入,到現在2.4版本,pivot運算元有了進一步增強,這使得後續無論是交給pandas繼續做處理,還是交給R繼續分析,都簡化了不少。大家無論在使用pandas、numpy或是R的時候,首

使用 Spark Pivot 處理複雜的資料統計需求

Pivot 運算元是 spark 1.6 版本開始引入的,在 spark2.4版本中功能做了增強,還是比較強大的 ,做過資料清洗ETL工作的都知道,行列轉換是一個常見的資料整理需求。spark 中的Pivot

Spark 排序算法系列之 GBTs 使用方式介紹

“ Spark推薦排序系列文章之GBDT(梯度提升決策樹)介紹” 01 — 前言 【Spark排序算法系列】主要介紹的是目前推薦系統或者廣告點選方面用的比較廣的

漫談加持Blink的Flink和Spark

前言 今天朋友圈有篇【阿里技術】發的文章,說Blink的效能如何強悍,功能現在也已經比較完善。譬如: Blink 在 TPC-DS 上和 Spark 相比有著非常明顯的效能優勢,而且這種效能

深度解析 Ignite 與 Spark的區別

經常有人拿Ignite 和Spark 進行比較,然後搞不清兩者的區別和聯絡。Ignite 和 Spark,如果籠統歸類,都可以歸於記憶體計算平臺,然而兩者功能上雖然有交集,並且 I

1745995051.0937