1. 程式人生 > >2018最新版本的spark面試題及答案

2018最新版本的spark面試題及答案

Spark是一個圍繞速度、易用性和複雜分析構建的大資料處理框架,Spark提供了一個全面、統一的框架用於管理各種有著不同性質(文字資料、圖表資料等)的資料集和資料來源(批量資料或實時的流資料)的大資料處理的需求。成為大資料核心技術之一,自然也成為了眾多企業面試的核心專業問題,小編針對spark整理了一套相關的面試題,正在學習大資料和正在面試大資料崗位的小夥伴可以參考使用了!

1、SDD,DAG,Stage怎麼理解?

2、寬依賴 窄依賴怎麼理解?

3、Stage是基於什麼原理分割task的?

4、血統的概念

5、任務的概念

6、容錯方法

7、粗粒度和細粒度

8、Spark優越性

9、Spark為什麼快

10、Transformation和action是什麼?區別?舉幾個常用方法

11、SDD怎麼理解

12、spark 作業提交流程是怎麼樣的,client和 cluster 有什麼區別,各有什麼作用

13、spark on yarn 作業執行流程,yarn-client 和 yarn cluster 有什麼區別

14、spark streamning 工作流程是怎麼樣的,和 storm 比有什麼區別

15、spark sql 你使用過沒有,在哪個專案裡面使用的

16、spark 機器學習和 spark 圖計算接觸過沒,,能舉例說明你用它做過什麼嗎?

17、spark sdd 是怎麼容錯的,基本原理是什麼?

以上就是小編整理的大資料技術之spark的面試參考題(相信對於學過大資料技術的同學應該不是難題吧,當然了有需要解析的也可以給小編留言滴),也是講師在講課過程中反覆給大家強調的重點,學習大資料並不是一朝一夕的事情,而是要付出很多的時間和精力。不是一套大資料面試題就能搞定你面試官的,技術崗位就需要一定的真材實料才能勝任,尤其是對於大資料技術人才的要求更是如此。

想想一個企業花重金聘請的大資料技術人才,如果技術不紮實或者沒有一定的專案經驗基礎,怎麼可能將這樣的核心崗位交給你呢?!透過面試題,看自己的實力是否能夠撐起大資料工程師的崗位!也讓自己明白學習大資料的重點應該放在哪些方面。