1. 程式人生 > >30個常見的大資料面試題 --讓你的薪資更上一層

30個常見的大資料面試題 --讓你的薪資更上一層

30個常見的大資料面試題:

  • 包含spark、scala、storm、hadoop等常見的大資料處理工具;
  • 常用的分散式資料庫如hbase、MongoDB、Redis等;
  • 其他常用的java基礎、linux相關技術等

1.scala 語言有什麼特點,什麼是函數語言程式設計?有什麼優點

2.scala 伴生物件有什麼作用

3.scala 併發程式設計是怎麼弄得,你對 actor 模型怎麼理解有何優點

4.Spark如何處理結構化資料,Spark如何處理非結構話資料?

5.Spark效能優化主要有哪些手段?

6.對於Spark你覺得他對於現有大資料的現狀的優勢和劣勢在哪裡?

7.對於演算法是否進行過自主的研究設計?

8.簡要描述你瞭解的一些資料探勘演算法與內容

9.怎麼用spark做資料清洗

10.跟我聊聊spark的應用,商場裡廣告投放,以及黃牛檢測

11.spark讀取 資料,是幾個Partition呢? hdfs幾個block 就有幾個 Partition?

12.Mogodb和hbase的區別

13.開發中遇到的問題

14.HIVE的優化

15.linux的啟動順序

16.編譯好的scala程式,執行時還需要scala環境嗎

17.Write a java program to implement Stack in java.

18.Linkedlist和ArrayList的區別

19.hadoop中combiner的作用

20.用mr設計一個分組排重計數演算法

21.用MapReduce找出存在公共好友的兩個人

22.hdfs儲存機制

23.MapReduce原理

24.hadoop執行原理

25.hadoop 的 namenode 宕機,怎麼解決

26.Hbase 的特性,以及你怎麼去設計 rowkey 和 columnFamily ,怎麼去建一個table

27.Redis,傳統資料庫,hbase,hive 每個之間的區別(問的非常細)

28.說下對hadoop 的一些理解,包括哪些元件

29.詳細講解下你流式實時計算的專案部署以及收集的結果情況

30.實時流式計算框架,幾個人,多長時間,細節問題,包括講flume ,kafka ,storm 的各個的元件組成,你負責那一塊,如果需要你搭建你可以完成麼?