1. 程式人生 > >機器學習面試 | 這些題目一定會被問到

機器學習面試 | 這些題目一定會被問到

0?wx_fmt=gif&wxfrom=5&wx_lazy=1

只要會做下面這些題目(主要看大類,具體問題及解析見《BAT機器學習面試1000題系列》連結見文末),就能輕鬆碾壓機器學習筆試面試~趕緊收藏吧!

計算機科學典型問題
  • 給定一棵二叉查詢樹中的兩個元素,求它們的最近公共祖先。

  • 基於比較的排序演算法的時間複雜度是什麼?證明?

  • 如何求一個帶權圖中兩個結點直接按的最短路徑?如果有些權值是負的怎麼辦?

  • 求一個字串中所有的迴文子串。

注意:對這些問題你都要能夠推導你的解法的時間和空間複雜度(大 O 表示法),並且儘量用最低的複雜度解決。只有通過大量的練習才能將這些不同型別的問題爛熟於胸,從而在面試中迅速地給出一個高效的解法。

數理統計與資料探勘問題
  • 當不知道資料所帶標籤時,可以使用哪種技術促使帶同類標籤的資料與帶其他標籤的資料相分離?

  • 資料預處理的方法有哪些?

  • 特徵選擇的標準方法是什麼?

  • 某超市研究銷售紀錄資料後發現,買啤酒的人很大概率也會購買尿布,這種屬於資料探勘的哪類問題?

注意:很多機器學習演算法都以數理統計作為理論基礎。對於這些基礎知識有清晰的概念是極為重要的。當然同時你也要能夠將這些抽象的概念與現實聯絡起來。

機器學習模型與演算法
  • 請簡要介紹下SVM,與LR的聯絡與區別是什麼?

  • 邏輯斯特迴歸為什麼要對特徵進行離散化?

  • 一個完整的機器學習專案流程有哪些?

  • 支援向量機的訓練在本質上是在最優化哪個值?

  • 你用一個給定的資料集訓練一個單隱層的神經網路,發現網路的權值在訓練中強烈地震盪(有時在負值和正值之間變化)。為了解決這個問題你需要調整哪個引數?

軟體工程和系統設計典型問題(擴充套件)
  • 你有一個電商網站,當用戶點選一個商品開啟詳情頁面時,你想基於商品特徵和使用者的購買歷史為使用者推薦 5 個其他的商品顯示在頁面的底部。你需要哪些服務和資料表來實現這個功能?請寫一個查詢語句或一段過程式程式碼來返回所要推薦的 5 個商品。

  • 一個簡單的垃圾郵件檢測系統是這樣的:它每次處理一封郵件,統計不同單詞的出現頻率(Term frequency),並將這些頻率與之前已經被標註為垃圾 / 正常郵件的那些頻率進行比較。現在需要對這系統進行拓展來處理海量的郵件流量,請設計一個 Map-Reduce 方案在一個叢集上部署這個系統。

為幫助對人工智慧感興趣的同學,以及想轉行到人工智慧領域的在職人士。七月線上特別推出《機器學習集訓營(三期)》,課程將以線上+線下(北京、上海兩個實戰基地)形式,引入BAT專家面對面、手把手教學方式

;突出BAT級工業專案實戰輔導,一步一步為你演示各個案例的實際操作,即使沒有任何基礎的同學也可以輕鬆上手。此外,還提供精講面試考點,一對一面試求職輔導,從入門到高薪,輕鬆達成!

本期限100個名額,歷時3個月,10多個BAT級工業專案,保障每一位學員所學更多、效率更高、收穫更大。

詳情點選文末“閱讀原文”,或者聯絡客服微信:julyedukefu(掃下面二維碼)

0?wx_fmt=jpeg

《BAT機器學習面試1000題系列》往期題目:

640?wx_fmt=png

相關推薦

機器學習面試 | 這些題目一定

只要會做下面這些題目(主要看大類,具體問題及解析見《BAT機器學習面試1000題系列》,連結見文

Vue面試中,經常到的面試題/Vue知識點整理

log 學習 ajax rom mount ams 特定 ren 原理 看看面試題,只是為了查漏補缺,看看自己那些方面還不懂。切記不要以為背了面試題,就萬事大吉了,最好是理解背後的原理,這樣面試的時候才能侃侃而談。不然,稍微有水平的面試官一看就能看出,是否有真才實學還是剛好

深度學習機器學習面試問題準備(必

第一部分:深度學習 1、神經網路基礎問題 (1)Backpropagation(要能推倒)    後向傳播是在求解損失函式L對引數w求導時候用到的方法,目的是通過鏈式法則對引數進行一層一層的求導。這裡重點強調:要將引數進行隨機初始化而不是全部置0,否則所有隱層的數值都會與輸入

面試筆試整理3:深度學習機器學習面試問題準備(必

第一部分:深度學習 1、神經網路基礎問題 (1)Backpropagation(要能推倒)   後向傳播是在求解損失函式L對引數w求導時候用到的方法,目的是通過鏈式法則對引數進行一層一層的求導。這裡重點強調:要將引數進行隨機初始化而不是全部置0,否則所

假如高考考python編程,這些題目幾個呢?

img 命令 OS 高級 map .com 學校 面試題 程序設計語言 Python(發音:英[?pa?θ?n],美[?pa?θɑ:n]),是一種面向對象、直譯式電腦編程語言,也是一種功能強大的通用型語言,已經具有近二十年的發展歷史,成熟且穩定。它包含了一組完善而且容易理

機器學習面試--樸素貝葉斯

eight str 存儲 hint 做的 均值 相關性 似然 actual 關鍵詞:先驗概率;條件概率和後驗概率;特征條件獨立;貝葉斯公式;樸素貝葉斯;極大似然估計;後驗概率最大化; 期望風險最小化;平滑方法 樸素貝葉斯分類的定義如下: 1. 設 x = a1,a2, ..

機器學習面試--算法評價指標

匹配 預測 src 數據挖掘 學習 關系 目標 mina abs 機器學習分為三個階段: 第一階段:學習模型。采用學習算法,通過對訓練集進行歸納學習得到分類模型; 第二階段:測試模型。將已經學習得到的分類模型用於測試集,對測試集中未知類別的實例進行分類。 第三階

面試時經常到的 3 個問題

本地 描述 邏輯 例子 換工作 繼續 腳本 比較 .com 前幾天,我在《簡歷中打動人的 3 個關鍵點》和《簡歷中千萬不要出現的 3 個問題》中講了一些寫簡歷的註意事項,今天想聊聊在面試過程中,如何更好的體現出自己的真實實力。 面試時,我經常會拿下面 3 個問題開場: 1

java常見面試問題.你一定預見到。

  1判斷一個char字元是不是數字:Character.isDigit(char)。是數字返回true,反之返回false。 2字串的toCharArray() 把字串轉換為字元陣列。返回char[]。 3在mySql資料庫中,在插入成功時,能夠方便的查詢出自動分配的id值是多少該怎麼辦呢?

白學Java系列一:這些題目嗎?

hashcode相等兩個類一定相等嗎?equals呢?相反呢? 介紹一下集合框架? hashmap hastable 底層實現什麼區別?hashtable和concurrenthashtable呢? hashmap和treemap什麼區別?低層資料

機器學習面試知識點之決策樹相關

決策樹面試知識點最全總結(一) 一:首先明確以下幾個基本問題: 1.決策樹是幹什麼用的? 一種最基本的分類與迴歸方法,因為實際應用中基本上全是用來分類,所以重點討論分類決策樹。 2.決策樹優缺點: 優點: 1)

不得不瞭解的機器學習面試知識點

  機器學習崗位的面試中通常會對一些常見的機器學習演算法和思想進行提問,在平時的學習過程中可能對演算法的理論,注意點,區別會有一定的認識,但是這些知識可能不繫統,在回答的時候未必能在短時間內答出自己的認識,因此將機器學習中常見的原理性問題記錄下來,保持對各個機器學習演算法原理和特點的熟練度。   本文總結了機

【原創】面試中肯定到的 2 個問題

之前我分別用三篇文章對簡歷和麵試注意事項做了說明: 《簡歷中千萬不要出現的 3 個問題》 《簡歷中打動人的 3 個關鍵點》 《面試時經常會被問到的 3 個問題》 今天是這個系列的第四篇,我們繼續聊面試,這次的兩個問題是: 為什麼離職? 本次想找一個什麼樣的工作

機器學習面試總結(第三篇)

9、整合學習大致分類?通俗理解怎樣才能提高整合學習的效能? 10、Booststrap sampling需要解決的問題?Booststrap sampling的思想?Bagging的基本思想?從偏差方差角度解釋bagging? 11、隨機森林RandomForest的思想?RF與bagg

基本機器學習面試問題 --- 理論/演算法2

線性迴歸 如何學習引數:最小化損失函式 如何最小化損失函式:梯度下降 正則化: L1(Lasso 迴歸):可以將某個係數縮小到零,從而執行特徵選擇; L2(Ridge 迴歸):以同樣的比例收縮所有係數 ; 幾乎總是勝過 L1; 合併(彈性網

機器學習面試之有必要手推SVM

SVM的數學問題求解上篇文章中,我們將SVM轉化成了如下的最優化問題:svms.t.svm2這裡,我們再做一個小小的轉化,將求最大值轉化成求最小值,因為總的來說,我們對求最小值的問題更加熟悉一點,轉化後是這個樣子:svm標準數學形式這個問題的求解,數學家們已經給出了完美的辦法

機器學習面試問題集(2018-3-13更新)

1 基礎概念 1.1 熵、聯合熵、條件熵、交叉熵與相對熵的意義? 1.2 歸一化方法? 1、線性函式歸一化(Min-Max scaling) 線性函式將原始資料線性化的方法轉換到[0 1]的範圍,歸一化公式如下: 2、0均值標準

GC是如何判斷一個物件為"垃圾"的?GC判斷為"垃圾"的物件一定回收嗎?

一.GC如何判斷一個物件為”垃圾”的 java堆記憶體中存放著幾乎所有的物件例項,垃圾收集器在對堆進行回收前,第一件事情就是要確定這些物件之中哪些還“存活”著,哪些已經“死去”。那麼GC具體通過什麼手段來判斷一個物件已經”死去”的? 1.引用計數演算法(已被

【收藏】2018年不容錯過的20大人工智慧/機器學習/計算機視覺等頂時間表

點選有驚喜 目錄 人工智慧/機器學習計算機視覺/模式識別自然語言處理/計算語言學體系結構資料探勘/資訊檢索計算機圖形學 人工智慧/機器學習 1. AAAI 2018 會議時間:2月2日~7日 會議地點: 新奧爾良市,美國 AAAI是人工智慧領域的主要學術

機器學習面試

引入對偶的好處 為什麼要引入對偶演算法 1.對偶問題往往更加容易求解(結合拉格朗日和kkt條件) 2.可以很自然的引用核函式(拉格朗日表達式裡面有內積,而核函式也是通過內積進行對映的) 要注意用拉格朗日對偶並沒有改變最優解,而是改變了演算法複雜度:在原問