Spark Streaming

解決spark streaming長時間執行日誌不斷增長問題

简书

2019-04-02 12:55:39

@[TOC](解決spark streaming長時間執行日誌不斷增長問題) 元件：基於CDH5.13、spark2.2.X 背景：由於s

Spark streaming消費Kafka的正確姿勢

稀土掘金

2019-03-26 11:58:34

前言在遊戲專案中，需要對每天千萬級的遊戲評論資訊進行詞頻統計，在生產者一端，我們將資料按照每天的拉取時間存入了Kafka當中，而在消費者一端，我們利用了spark streaming從kafka中不斷拉取

Spark Streaming調優引數及最佳實踐深入剖析-Spark商業調優實戰

稀土掘金

2018-11-27 15:29:36

本套技術專欄是作者（秦凱新）平時工作的總結和昇華，通過從真實商業環境抽取案例進行總結和分享，並給出商業應用的調優建議和叢集環境容量規劃等內容，請持續關注本套部落格。版權宣告：禁止轉載，歡迎學習。QQ郵箱地址：1

Spark Streaming + Kafka 的 offset 管理方法

2018-11-03 07:57:37

點選上方藍字關注【北郵郭大寶】最近實習需要開發一套Spark Streaming的實時流處理專案，內心還是很期待的。說來慚愧，做大資料開發實習一年有餘了，都是離線批處理的任務，還沒親自操

Apache 流框架 Flink，Spark Streaming，Storm對比分析（2）

稀土掘金

2018-10-31 15:04:16

此文已由作者嶽猛授權網易雲社群釋出。歡迎訪問網易雲社群，瞭解更多網易技術產品運營經驗。 2.Spark Streaming架構及特性分析 2.1 基本架構基於是spark c

如何構建一個flink sql平臺

簡書

2018-10-29 18:11:00

1、spark Streaming是一個微批處理的框架 2、批處理時間間隔 batchInterval >> 表示在batchInterval時間內Spark 所接收的資料被當做一個批次做

Spark Streaming核心概念與程式設計

部落格園精華區

2018-10-28 23:49:00

Spark Streaming核心概念與程式設計 1. 核心概念 StreamingContext Create StreamingContext import

Spark Streaming 設計原理

分散式和儲存的那些事

2018-10-28 08:06:07

最近兩年流式計算又開始逐漸火了起來，說到流式計算主要分兩種：continuous-based 和 micro-batch。最近在使用基於 micro-batch 模式的 Spark Streaming

金九銀十鐵12，目前騰訊、美團等五家大廠都收到意向offer

簡書

2018-09-19 17:28:14

網際網路提前批基本告一段落，大大小小的offer也拿了一些，秉著回報社會，堅持中國特色社會主義，挽救新一程式碼農的思想，整理了下各個公司的麵筋、考點，希望能激勵各位搬磚工，起到鼓足幹勁，力爭上游的作用O(

Spark 排序算法系列之（MLLib、ML）LR 使用方式介紹

2019-05-15 09:16:27

“ 【Spark排序算法系列】主要介紹的是目前推薦系統或者廣告點選方面用的比較廣的幾種演算法，和他們在Spark中的應用實現，本篇文章主要介紹LR演算法。 ”

Spark local模式連線叢集hdfs、hive

稀土掘金

2019-05-14 23:06:09

Spark提供了local、standalone、on yarn等多種執行模式，但為了保持開發環境與實際執行環境的一致性，通常都是在本地編寫程式碼，然後編譯並上傳jar包到Spark叢集除錯執行。但是面對複雜

Spark學習——資料傾斜

稀土掘金

2019-05-04 20:18:41

資料傾斜是一種很常見的問題（依據二八定律），簡單來說，比方WordCount中某個Key對應的資料量非常大的話，就會產生資料傾斜，導致兩個後果： OOM（單或少數的節點）；拖慢整個Job

Apache Spark 記憶體管理詳解(下)

開源技術架構

2019-04-29 11:07:47

導讀：本文是續接上一篇《 Apache Spark記憶體管理詳解(上) 》（未閱讀的同學可以點選檢視）的內容，主要介紹兩部分：儲存記憶體管理，包含 RDD的持久化機制、RDD快取的過程、淘汰和

重磅 | Apache Spark 社群期待的 Delta Lake 開源了

過往記憶大資料

2019-04-26 11:52:50

本文原文（點選下面閱讀原文即可進入） https://www.iteblog.com/archives/2545.html 2019年4月24日在美國舊金山召開的 Spark+AI Summit

基於Spark的機器學習實踐 (七) - 迴歸演算法

簡書

2019-04-15 22:56:08

0 相關原始碼 1 迴歸分析概述 1.1 迴歸分析介紹 ◆ 迴歸與分類類似，只不過迴歸的預測結果是連續的,而分類的預測結果是離散的 ◆ 如此,使得很多回歸與分類的模型可以經過改動