1. 程式人生 > >一些演算法崗的校招面經

一些演算法崗的校招面經

從今年3月份暑期實習到秋招一直投的演算法崗(資料探勘、機器學習),今年聽說投演算法的人特別多,競爭激烈,自己之前本來想去金融,後來覺得還是喜歡網際網路,從去年11月才開始好好看書,又不是CS科班出身,所以面試毫無優勢可言。基本上把大半個網際網路公司都面了一遍,雖然掛的太多,但面試官水平都很高,面試中也學到了很多東西,認識到很多地方不足,要學的東西太多。

有的時間太久,細節想不起來了,想起來再慢慢更新,把不知道的知識點補上,寫的亂湊合著看

攜程(實習):

1.    講專案

2.    寫一下LR損失函式

3.    SQL題,很簡單,但當時沒想出來…

4.    GBDT、xgboost用過嗎,解釋一下

5.    距離公式有哪些(餘弦距離等)

6.    特徵怎麼選擇

7.    隨機森林

8.    優化BFGS瞭解嗎

滴滴(實習+校招):

過完年回來,參加映像最深刻的實習面試,全程3小時,其實問的很基礎,但是自己沒有好好準備,很多基礎掌握不牢。

1.     講專案

2.     SQL:leftjoin、inner join區別,寫了一道題

3.     SVM是什麼、核函式有哪些、怎麼選擇

4.     LR損失函式推導一下

5.     隨機森林、Adboost

6.     AUC、ROC、recall、precision寫公式,AUC的直觀解釋

7.     CNN的卷積公式

8.     損失函式不可導,梯度下降法怎麼辦?(次梯度?)

9.     Python中list和tuple的區別

10.   正負樣本不平衡怎麼辦

11.   決策樹怎麼剪枝

12.   問了些資料結構

校招(沒面完):

1.     寫個快排、改進、find(s,p),寫了4道程式碼題

2.     200G日誌用筆記本找Top100的query

3.     解釋一下xgboost

4.     講專案,用到了哪些特徵

阿里(實習+校招)

內推的螞蟻的風控部門

一面:

1.    7月底就打了電話,主要是講專案,然後針對專案提了很多問題,面試官水平很高

2.    資料樣本構造、樣本選取

3.    講了word2vec以及怎麼應用

4.    看過什麼前沿的論文

5.    垃圾評論檢測

二面(掛):

1.    聊專案

2.    文字相似度計算為什麼不用SVD…

3.    瞭解哪些優化演算法

騰訊(實習+校招)

實習做了筆試,邀請到酒店面試,是一個小哥,很和藹

1.    自我介紹,講了一個專案

2.    Xgboost、隨機森林的區別,xgboost怎麼並行

3.    L1、L2正則化的區別,為什麼L1得到稀疏解

4.    解釋一下SGD、drop_out、神經網路的BN層

5.    程式碼題:最長子序列的乘積

(第二天查了狀態是複試中,但到最後也沒收到複試通知,最後一天查狀態掛了…)

秋招內推,騰訊遊戲的部門

一面(視訊面,全程寫程式碼)

1.    寫LR公式

2.    DNN前向傳播、反向傳播,求梯度

3.    實現一下shuffle函式

4.    瞭解強化學習、增強對抗學習嗎(不瞭解)

二面(掛):

1.    講專案

2.    K-means、隨機森林、DNN怎麼調參

3.    怎麼防止過擬合

4.    C++記憶體怎麼分配(說不知道,直接跪)

5.    寫C字串拷貝函式strcpy

6.    寫判斷是否二叉排序樹

美團(校招)

1.     推薦演算法:SVD、協同過濾等,怎麼做推薦的

2.     解釋一下CNN、RNN

3.     資料怎麼處理、特種工程

4.     特徵選擇怎麼做、決策樹怎麼分裂的

5.     推薦系統好壞評價

6.     解釋一下AB測試

7.     提高外賣配送效率,需要考慮哪些因素

8.     樣本怎麼構造、資料量有多大

9.     餘弦距離和歐氏距離區別

10.   評論反作弊(被問了不下於3次)

京東(實習+校招)

校招投的上海這邊演算法組,面了兩面說對我很滿意,要給部門老大看,但不一定有offer,因為老大手上簡歷太多…

1.    講專案,特別是衡量指標

2.    怎麼做推薦的

3.    決策時、GBDT、Xgboost講一下區別

4.    Sql題:怎麼用join實現分組排序和分組累加和

5.    問了專案的word2vec和doc2vec演算法、問了推薦怎麼做的

6.    LSTM和RNN區別

百度(校招)

先是內推,面完3面後很久沒收到訊息,就知道掛了

一面:

1.    xgboost與GBDT比較

2.    Python中numpy為什麼快,說用的C實現,然後問C++中STL底層,完全不會

3.    Python中能表示的最大數

4.    怎麼做推薦、文字處理方法

5.    寫程式碼:求兩個字串的最小編輯距離

二面:

1.     CNN怎麼做文字分類

2.     怎樣快速計算x的根號3次方,有記憶體限制,不能調庫函式(這個問題糾結了很久)

三面:

經理面,從技術到人生都問了很多

1.     寫個程式碼,求兩個有序陣列的交集,O(n),沒想出來,只想出了一個二分查詢

2.     協同過濾

3.     開放題,輸入一個劉,彈出劉德華之類的,怎麼做

校招霸面:

二面是百度鳳巢的,感覺水平很高,答的不好,掛了

1.     資訊熵、資訊增益、相對熵、交叉熵、互資訊、基尼係數

2.     常用的有哪些損失函式,推導一下log loss的梯度

3.     寫個程式碼:快速排序,平均時間複雜度、最壞情況

4.     怎樣確定取樣的樣本數量

5.     特徵工程怎麼做

6.     特徵值、特徵向量解釋一下

7.     解釋一下決策樹、隨機森林

8.     推薦系統考慮的因素特徵

9.     路徑優化考慮哪些因素

10.   寫個程式碼:字串去重函式

愛奇藝(校招)

1.    寫個二叉樹反轉

2.    資訊熵公式

3.    CNN卷積的物理含義、pooling的作用

4.    畫一下word2vec中的skip-gram模式圖

5.    概率題:54張抽出2張同花色的概率,大小王任意一種花色都不算

還面了華為、唯品會之類的,基本都是聊專案,所以沒什麼好寫的,後面想起了再更新