1. 程式人生 > >【Big Data 每日一題】目錄

【Big Data 每日一題】目錄

Spark

【Big Data 每日一題】Spark開發效能調優總結

【Big Data 每日一題20180821】Spark中ml和mllib的區別?

【Big Data 每日一題20180828】Maven 中 jar 包的 Snapshot 和 Release 版本區別?

【Big Data 每日一題20180829】Spark on Yarn 的兩種執行模式?

【Big Data 每日一題20180830】關於 Metrics ?

【Big Data 每日一題20180831】Spark 的 tasks 資訊, Locality Level 種類?

【Big Data 每日一題20180905】Spark Shuffle FetchFailedException解決方案

【Big Data 每日一題20180906】Spark效能調優篇一之任務提交引數調整

【Big Data 每日一題20180907】Spark效能調優篇二之重構RDD架構及RDD持久化

【Big Data 每日一題20180908】Spark效能調優篇三之廣播方式傳輸資料

【Big Data 每日一題20180909】Spark效能調優篇四之使用Kryo進行序列化操作

【Big Data 每日一題20180910】Spark效能調優篇五之使用fastUtil工具包

【Big Data 每日一題20180911】Spark效能調優篇六之調節資料本地化等待時長

【Big Data 每日一題20180912】Spark效能調優篇七之JVM相關引數調整

【Big Data 每日一題20180913】Spark效能調優篇八之shuffle調優(重要)

【Big Data 每日一題20180914】Spark效能調優九之常用運算元調優

【Big Data 每日一題20180915】Spark編碼時,static 變數慎用?

【Big Data 每日一題20180916】Spark累加器(Accumulator)陷阱及解決辦法

【Big Data 每日一題20180917】資料本地化的幾種級別

【Big Data 每日一題20180919】Spark核心分析之spark作業的三種提交方式

【Big Data 每日一題20180920】org.apache.spark.SparkException: Task not serializable

【Big Data 每日一題20180921】Spark 序列化問題

【Big Data 每日一題20180922】sparkstreaming同時消費多個topic的資料實現exactly-once的語義

【Big Data 每日一題20180923】Structured Streaming 實現思路與實現概述

【Big Data 每日一題20180924】Structured Streaming 之 Source 解析

【Big Data 每日一題20180925】Structured Streaming 之 Sink 解析

【Big Data 每日一題20180926】Structured Streaming 之狀態儲存解析

【Big Data 每日一題20180927】Structured Streaming 之 Event Time 解析

【Big Data 每日一題20180928】Structured Streaming 之 Watermark 解析

【Big Data 每日一題20180929】對spark2.3.0中Structured Streaming低延遲持續處理模式的介紹

【Big Data 每日一題20180930】StructuredStreaming官方文件翻譯

 

【Big Data 每日一題】sparkstreaming 反壓機制

【Big Data 每日一題】spark shuffle 過程

【Big Data 每日一題】spark  yarn 執行模式

【Big Data 每日一題】spark master client關係?

【Big Data 每日一題】spark  pageCache

【Big Data 每日一題】KryoSerializer  使用場合

【Big Data 每日一題】spark cpu 死

【Big Data 每日一題】structured streaming

Spark學習之10:Task執行結果返回流程

https://blog.csdn.net/ktlinker1119/article/details/45870969

swap機制

 

spark 效能調優

 

Hadoop

1、journalnode 作用

2、journal  Quorum 排程

 

問題:
hive hdfs 關係
叢集的關係

 

 

Hbase

【Big Data 每日一題20180816】 陣列為什麼比list 效率高?

【Big Data 每日一題20180815】 HBase 與 zookeeper 之間的關係?

【Big Data 每日一題20180814】hadoop中有幾個檔案,spark就會有幾個Partition麼?

HIVE

【Big Data 每日一題20180918】 Hive  filter pushdown ? (英)

KAFKA

【Big Data 每日一題20180901】 Kafka相對傳統技術有什麼優勢

【Big Data 每日一題20180902】 Kafka 最大的特點?

【Big Data 每日一題20180903】 Kafka的Zookeeper關係?

【Big Data 每日一題20180904】ISR策略(in-sync Replica) ?

YARN

 

JVM

【Big Data 每日一題XXXX】調優

【Big Data 每日一題20180822】Java動態編譯優化——URLClassLoader 記憶體洩漏問題解決

【Big Data 每日一題20180824】為什麼有棧記憶體和堆記憶體之分

 

Linux

 

【Big Data 每日一題20180823】Linux 中 ulimit 作用

【Big Data 每日一題20180824】Linux傳統Huge Pages與Transparent Huge Pages  ????

【Big Data 每日一題20180825】Linux中SELinux    ?????

【Big Data 每日一題20180826】 Kernel  ????

【Big Data 每日一題20180827】linux 管道命令 與 管道通訊

 

Ansible

 

其他

待編輯【Big Data 每日一題】多版本併發控制是什麼?

待編輯【Big Data 每日一題】Kylin 的 Cube 模型?

待編輯【Big Data 每日一題】OLAP引擎  ----  Kylin 介紹?