1. 程式人生 > >百度實習面試經驗(待續)

百度實習面試經驗(待續)

百度實習的面試是師兄內推的,直接是一輪電話面試加一輪現場技術面試,所以沒有筆試經驗。簡歷是自然語言處理演算法相關(本渣真正有深入接觸的只有短文字語義相似度計算,其他最多略知皮毛),師兄內推的是一個多模態語義計算小組,涉及到圖片問答、藉助知識圖譜的語義推理等。

電話面試:

整體來說電話面試沒做好準備,倉促慌亂(直接從本科畢業的暑假浪完一圈回來,臨時決定找的實習)。

1 首先問的一個問題是關於之前做的一個比賽(螞蟻金服的客服問題語義相似度計算),問用到了什麼模型,我說了模型的名字,又問模型最後的啟用函式是什麼,我當時聽到“最後”,直接反應是softmax,重點是後來依然腦抽,說交叉熵,也是經驗不足,犯了這樣的低階錯誤。好歹後來冷靜下來說是 elu函式。

2 tensorflow使用到怎樣的程度,模型的程式碼是自己寫的嗎?有實現過LSTM嗎?

3 接著問是否是使用Tensorflow,給了一個題,對任意取值的一個32位浮點型別的tensor,將其中大於0的元素置為1,小於等於零的元素置為-1,其實是很簡單的一個題,當時第一反應是使用argmax,確實可以做,但是具體怎麼實現一時沒想出倆,面試官也該是沒想到argmax可以實現,向我確認了一下,我停了幾秒,說出了另外一種簡單的思路,既是直接判定tensor中的元素,使用tf.where即可(但當時認為這個太簡單,沒有說出具體的函式,實際上在面試中如果能說出更多準確的細節,就儘可能說),但在說這個簡單思路的過程中,腦袋裡又確認了argmax是可以實現的,只是比較複雜,但是說了半天也沒和麵試官說清,主要也是因為對相關操作掌握不熟練,具體的實現並不清晰。直到最後面試官要求直接發一封郵件簡單說明一下思路算是結束這個問題。

4 面試官又問傳統機器學習演算法瞭解嘛,知道哪些。我隨口說了決策樹,SVM,然後她讓我講一下,我就簡單說了決策樹的原理及比較了一下三種決策樹生成演算法(ID3, C4.5, CART),然後她問我決策樹的優缺點,我一時只想到決策樹構建簡單的優點和容易被攻擊的缺點,面試官問我還有嗎?我說不知道了,這個問題也沒有完全通過。

5 簡歷上有寫LDA,是否有了解? 

6 關於linux相關,有一個帶搜尋欄位和搜尋頻率的小檔案,不在乎時間複雜度,快速的找出頻率top5的搜尋記錄?為什麼不使用awk? 找出一個檔案中帶有”天氣”一詞的記錄?

技術面試:

1 簡單自我介紹

2 介紹一下你覺得做過的最好的專案

3 轉到傳統機器學習,接觸過概率圖嗎?看你簡歷上有寫使用過xgboost, 簡要說一下xgboost, 之前為什麼這麼火?

4 簡要說一下邏輯迴歸,是判別式模型還是生成式模型,為什麼?

5 轉到之前實習做過有關spark大資料處理的經驗,介紹一下用spark做了哪些工作,有用過其他大資料平臺嗎?比如Hadoop?

6 問了一些瑣碎的技術問題, 

7 演算法題,

   1)有一段文字,找出其中所有的日期並返回。

   2) 給你一棵二叉樹的節點,返回樹的高度。