1. 程式人生 > >分享:15道大資料崗位面試題

分享:15道大資料崗位面試題

你認為哪個更好:是好的資料還是好模型?同時你是如何定義“好”?存在所有情況下通用的模型嗎?有你沒有知道一些模型的定義並不是那麼好?
分享:15道大資料崗位面試題
1、你處理過的最大的資料量?你是如何處理他們的?處理的結果。
2、告訴我二個分析或者電腦科學相關專案?你是如何對其結果進行衡量的?
3、什麼是:提升值、關鍵績效指標、強壯性、模型按合度、實驗設計、2/8原則?
4、什麼是:協同過濾、n-grams, map reduce、餘弦距離?
5、如何讓一個網路爬蟲速度更快、抽取更好的資訊以及更好總結資料從而得到一干淨的資料庫?
6、如何設計一個解決抄襲的方案?
7、如何檢驗一個個人支付賬戶都多個人使用?
8、點選流資料應該是實時處理?為什麼?哪部分應該實時處理?
9、你認為哪個更好:是好的資料還是好模型?同時你是如何定義“好”?存在所有情況下通用的模型嗎?有你沒有知道一些模型的定義並不是那麼好?
10、什麼是概率合併(AKA模糊融合)?使用SQL處理還是其它語言方便?對於處理半結構化的資料你會選擇使用哪種語言?
11、你是如何處理缺少資料的?你推薦使用什麼樣的處理技術?
12、你最喜歡的程式語言是什麼?為什麼?
13、對於你喜歡的統計軟體告訴你喜歡的與不喜歡的3個理由。
14、SAS, R, Python, Perl語言的區別是?
15、什麼是大資料的詛咒?
很多初學者,對大資料的概念都是模糊不清的,大資料是什麼,能做什麼,學的時候,該按照什麼線路去學習,學完往哪方面發展,想深入瞭解,想學習的同學歡迎加入大資料學習qq群:458345782,有大量乾貨(零基礎以及進階的經典實戰)分享給大家,並且有清華大學畢業的資深大資料講師給大家免費授課,給大家分享目前國內最完整的大資料高階實戰實用學習流程體系

分享:15道大資料崗位面試題