【Big Data 每日一題】目錄
Spark
【Big Data 每日一題】Spark開發效能調優總結
【Big Data 每日一題20180821】Spark中ml和mllib的區別?
【Big Data 每日一題20180828】Maven 中 jar 包的 Snapshot 和 Release 版本區別?
【Big Data 每日一題20180829】Spark on Yarn 的兩種執行模式?
【Big Data 每日一題20180830】關於 Metrics ?
【Big Data 每日一題20180831】Spark 的 tasks 資訊, Locality Level 種類?
【Big Data 每日一題20180905】Spark Shuffle FetchFailedException解決方案
【Big Data 每日一題20180906】Spark效能調優篇一之任務提交引數調整
【Big Data 每日一題20180907】Spark效能調優篇二之重構RDD架構及RDD持久化
【Big Data 每日一題20180908】Spark效能調優篇三之廣播方式傳輸資料
【Big Data 每日一題20180909】Spark效能調優篇四之使用Kryo進行序列化操作
【Big Data 每日一題20180910】Spark效能調優篇五之使用fastUtil工具包
【Big Data 每日一題20180911】Spark效能調優篇六之調節資料本地化等待時長
【Big Data 每日一題20180912】Spark效能調優篇七之JVM相關引數調整
【Big Data 每日一題20180913】Spark效能調優篇八之shuffle調優(重要)
【Big Data 每日一題20180914】Spark效能調優九之常用運算元調優
【Big Data 每日一題20180915】Spark編碼時,static 變數慎用?
【Big Data 每日一題20180916】Spark累加器(Accumulator)陷阱及解決辦法
【Big Data 每日一題20180917】資料本地化的幾種級別
【Big Data 每日一題20180919】Spark核心分析之spark作業的三種提交方式
【Big Data 每日一題20180920】org.apache.spark.SparkException: Task not serializable
【Big Data 每日一題20180921】Spark 序列化問題
【Big Data 每日一題20180922】sparkstreaming同時消費多個topic的資料實現exactly-once的語義
【Big Data 每日一題20180923】Structured Streaming 實現思路與實現概述
【Big Data 每日一題20180924】Structured Streaming 之 Source 解析
【Big Data 每日一題20180925】Structured Streaming 之 Sink 解析
【Big Data 每日一題20180926】Structured Streaming 之狀態儲存解析
【Big Data 每日一題20180927】Structured Streaming 之 Event Time 解析
【Big Data 每日一題20180928】Structured Streaming 之 Watermark 解析
【Big Data 每日一題20180929】對spark2.3.0中Structured Streaming低延遲持續處理模式的介紹
【Big Data 每日一題20180930】StructuredStreaming官方文件翻譯
【Big Data 每日一題】sparkstreaming 反壓機制
【Big Data 每日一題】spark shuffle 過程
【Big Data 每日一題】spark yarn 執行模式
【Big Data 每日一題】spark master client關係?
【Big Data 每日一題】spark pageCache
【Big Data 每日一題】KryoSerializer 使用場合
【Big Data 每日一題】spark cpu 死
【Big Data 每日一題】structured streaming
Spark學習之10:Task執行結果返回流程
https://blog.csdn.net/ktlinker1119/article/details/45870969
swap機制
spark 效能調優
Hadoop
1、journalnode 作用
2、journal Quorum 排程
問題:
hive hdfs 關係
叢集的關係
Hbase
【Big Data 每日一題20180816】 陣列為什麼比list 效率高?
【Big Data 每日一題20180815】 HBase 與 zookeeper 之間的關係?
【Big Data 每日一題20180814】hadoop中有幾個檔案,spark就會有幾個Partition麼?
HIVE
【Big Data 每日一題20180918】 Hive filter pushdown ? (英)
KAFKA
【Big Data 每日一題20180901】 Kafka相對傳統技術有什麼優勢
【Big Data 每日一題20180902】 Kafka 最大的特點?
【Big Data 每日一題20180903】 Kafka的Zookeeper關係?
【Big Data 每日一題20180904】ISR策略(in-sync Replica) ?
YARN
JVM
【Big Data 每日一題XXXX】調優
【Big Data 每日一題20180822】Java動態編譯優化——URLClassLoader 記憶體洩漏問題解決
【Big Data 每日一題20180824】為什麼有棧記憶體和堆記憶體之分
Linux
【Big Data 每日一題20180823】Linux 中 ulimit 作用
【Big Data 每日一題20180824】Linux傳統Huge Pages與Transparent Huge Pages ????
【Big Data 每日一題20180825】Linux中SELinux ?????
【Big Data 每日一題20180826】 Kernel ????
【Big Data 每日一題20180827】linux 管道命令 與 管道通訊
Ansible
其他
待編輯【Big Data 每日一題】多版本併發控制是什麼?
待編輯【Big Data 每日一題】Kylin 的 Cube 模型?
待編輯【Big Data 每日一題】OLAP引擎 ---- Kylin 介紹?