機器學習與深度學習常見面試題（下）

阿新 • • 發佈：2018-11-13

原創宣告：本文為SIGAI 原創文章，僅供個人學習使用，未經允許，不得轉載，不能用於商業目的。

1、為什麼隨機森林能降低方差？

隨機森林的預測輸出值是多課決策樹的均值，如果有n個獨立同分布的隨機變數 $x_{i}$ ，它們的方差都為 $\sigma^{2}$ ，則它們的均值的方差為：

2、對於帶等式和不等式約束的優化問題，KKT條件是取得極值的充分條件還是必要條件？對於SVM呢？

對於一個一般的問題，KKT條件是取得極值的必要條件而不是充分條件。對於凸優化問題，則是充分條件，SVM是凸優化問題

3、解釋維數災難的概念

當特徵向量數理很少時，增加特徵，可以提高演算法的精度，但當特徵向量的維數增加到一定數量之後，再增加特徵，演算法的精度反而會下降

4、Logistic迴歸為什麼用交叉熵而不用歐氏距離做損失函式？

如果用歐氏距離，不是凸函式，而用交叉熵則是凸函式

5、解釋hinge loss損失函式

如果樣本沒有違反不等式約束，則損失為0；如果違反約束，則有一個正的損失值

6、解釋GBDT的核心思想

用加法模擬，更準確的說，是多棵決策樹樹來擬合一個目標函式。每一棵決策樹擬合的是之前迭代得到的模型的殘差。求解的時候，對目標函式使用了一階泰勒展開，用梯度下降法來訓練決策樹

7、解釋XGBoost的核心思想

在GBDT的基礎上，目標函式增加了正則化項，並且在求解時做了二階泰勒展開

8、解釋DQN中的經驗回放機制，為什麼需要這種機制？

將執行動作後得到的狀態轉移構造的樣本儲存在一個列表中，然後從中隨機抽樣，來訓練Q網路。為了解決訓練樣本之間的相關性，以及訓練樣本分佈變化的問題

9、什麼是反捲積？

反捲積也稱為轉置卷積，如果用矩陣乘法實現卷積操作，將卷積核平鋪為矩陣，則轉置卷積在正向計算時左乘這個矩陣的轉置 $W^{T}$ ，在反向傳播時左乘W，與卷積操作剛好相反，需要注意的是，反捲積不是卷積的逆運算

10、反捲積有哪些用途？

實現上取樣；近似重構輸入影象，卷積層視覺化

11、PCA（主成分分析）優化的目標是什麼？

最小化重構誤差/最大化投影后的方差

12、LDA（線性判別分析）優化的目標是什麼？

最大化類間差異與類內差異的比值

13、解釋神經網路的萬能逼近定理

只要啟用函式選擇得當，神經元的數理足夠，至少有一個隱含層的神經網路可以逼近閉區間上任意一個連續函式到任意指定的精度

14、softmax迴歸訓練時的目標函式時凸函式嗎？

是，但有不止一個全域性最優解

15、SVM為什麼要求解對偶問題？為什麼對偶問題與原問題等價？

原問題不容易求解，含有大量的不易處理的不等式約束。原問題滿足Slater條件，強對偶成立，因此原問題與對偶問題等價

16、神經網路是生成模型還是判別模型？

判別模型，直接輸出類別標籤，或者輸出類後驗概率p(y|x)

17、logistic迴歸是生成模型還是判別模型？

判別模型，直接輸出類後驗概率p(y|x)，沒有對類條件概率p(x|y)或者聯合概率p(x, y)建模

18、對於支援向量機，高斯核一般比線性核有更好的精度，但實際應用中為什麼一般用線性核而不用高斯核？

如果訓練樣本的量很大，訓練得到的模型中支援向量的數量太多，在每次做預測時，高斯核需要計算待預測樣本與每個支援向量的內積，然後做核函式變換，這會非常耗；而線性核只需要計算 $W^{T}X+b$

19、高斯混合模型中，為什麼各個高斯分量的權重之和要保證為1？

為了保證這個函式時一個概率密度函式，即積分值為1

20、介紹beam search演算法的原理

這是一種解碼演算法，每次選擇概率最大的幾個解作為候選解，逐步擴充套件

21、介紹seq2seq的原理

整個系統由兩個RNN組成，一個充當編碼器，一個充當解碼器；編碼器依次接收輸入的序列資料，當最後一個數據點輸入之後，將迴圈層的狀態向量作為語義向量，與解碼器網路的輸入向量一起，送入解碼器中進行預測

22、介紹CTC的原理

CTC通過引入空白符號，以及消除連續的相同符號，將RNN原始的輸出序列對映為最終的目標序列。可以解決對未對齊的序列資料進行預測的問題，如語音識別

23、介紹廣義加法模型的原理

廣義加法模型用多個基函式的和來擬合目標函式，訓練的時候，依次確定每個基函式

24、為什麼很多時候用正態分佈來對隨機變數建模？

現實世界中很多變數都服從或近似服從正態分佈。中心極限定理指出，抽樣得到的多個獨立同分布的隨機變數樣本，當樣本數趨向於正無窮時，它們的和服從正態分佈

25、Batch Normalization 和 Group Normalization有何區別？

BN是在batch這個維度上進行歸一化，GN是計算channel方向每個group的均值和方差

26、GAN中模型坍塌（model collapse）是指什麼？

模型坍塌，即產生的樣本單一，沒有了多樣性。

27、目前GAN訓練中存在的主要問題是什麼？

（1）訓練不易收斂（2）模型坍塌

28、Shufflenet為什麼效果會好？

通過引入“通道重排”增加了組與組之間資訊交換

29、模型壓縮的主要方法有哪些？

（1）從模型結構上優化：模型剪枝、模型蒸餾、automl直接學習出簡單的結構

（2）模型引數量化將FP32的數值精度量化到FP16、INT8、二值網路、三值網路等

30、目標檢測中IOU是如何計算的？

檢測結果與Ground Truth 的交集比上它們的並集，即為檢測的準確率IoU

31、給定0-1矩陣，如何求連通域？

可採用廣度優先搜尋

32、OCR任務中文字序列識別的主流方法是什麼？

RNN+CTC

33、在神經網路體系結構中，哪些會有權重共享？？

（1）卷積神經網路

（2）遞迴神經網路

（3）全連線網路

答案（1）&（2）

34、一個典型人臉識別系統的識別流程？

人臉檢測--》人臉對齊--》人臉特徵提取--》人臉特徵比對

35、平面內有兩個矩形，如何快速計算它們的IOU？

36、使用深度卷積網路做影象分類如果訓練一個擁有1000萬個類的模型會碰到什麼問題？

提示：記憶體/視訊記憶體佔用；模型收斂速度等

37、 HMM和CRF的區別？

前者描述的是P(X,Y)=P(X|Y)*P(Y), 是generative model; 後者描述的是P(Y|X), 是discriminative model. 前者你要加入對狀態概率分佈的先驗知識，而後者完全是data driven.

38、深度學習中為什麼不用二階導去優化？

Hessian矩陣是n*n，在高維情況下這個矩陣非常大，計算和儲存都是問題

39、深度機器學習中的mini-batch的大小對學習效果有何影響？

mini-batch太小會導致收斂變慢，太大容易陷入sharp minima，泛化性不好

40、線性迴歸對於資料的假設是怎樣的？

http://en.wikipedia.org/wiki/Linear_regression

（1）線性，y是多個自變數x之間的線性組合

（2）同方差性，不同的因變數x的方差都是相同的

（3）弱外生性，假設用來預測的自變數x是沒有測量誤差的

（4）預測變數之中沒有多重共線性

41、什麼是共線性, 跟過擬合有啥關聯?

共線性：多變數線性迴歸中，變數之間由於存在高度相關關係而使迴歸估計不準確。

共線性會造成冗餘，導致過擬合。

解決方法：排除變數的相關性／加入權重正則。

42、Bias和Variance的區別？

Bias量了學習演算法的期望預測與真實結果的偏離程度，即刻畫了演算法本身的擬合能力。

Variance度量了同樣大小的訓練集的變動所導致的學習效能變化，即刻畫了資料擾動所造成的影響。

機器學習與深度學習常見面試題（下）

原創宣告：本文為SIGAI 原創文章，僅供個人學習使用，未經允許，不得轉載，不能用於商業目的。 1、為什麼隨機森林能降低方差？隨機森林的預測輸出值是多課決策樹的均值，如果有n個獨立同分布的隨機變數，它們的方差都為，

第十二章 Shell腳本編寫及常見面試題（二）

shell腳本 shell面試題 shell本章目錄：12.11 屏蔽網站訪問頻繁的IP1）屏蔽每分鐘訪問超過200的IP方法1：以Nginx日誌作為測試DATE=$(date +%d/%b/%Y:%H:%M) ABNORMAL_IP=$(tail -n5000 access.log |grep $DATE

php常見面試題（2）

文字 select lec 面試題 subst 分析 mat 例如 %d 1、session與cookie的區別　　1、cookie數據存放在客戶的瀏覽器上，session數據放在服務器上。　　2、cookie不是很安全，別人可以分析存放在本地的COOKIE並進行COO

php 常見面試題（3）

earch tla 遍歷目錄 phpstudy ech key -c clas handle 1、數組$a = array(‘a‘=>‘a‘,‘b‘=>‘b‘,‘c‘=>‘c‘)，如何將array（‘d’=>‘d‘）快速插入 a 和 b 之間？ f

【JAVA秒會技術之秒殺面試官】JavaEE常見面試題（一）

parameter 和數程序配置 except 查詢解析 list 就會 1.Struts2中，Action通過什麽方式獲取用戶從頁面輸入的數據，又是通過什麽方法把數據傳給視圖層顯示的？答：（1）Action從頁面獲取數據的方式有三種： ①通過Act

【JAVA秒會技術之秒殺面試官】JavaSE常見面試題（二）

方法變量 dir 步驟註解無法 t對象面試線程 21.在Java中，如何跳出當前的多重嵌套循環？答：在最外層循環前加一個標記如A，然後用break A;可以跳出多重循環。（Java中支持帶標簽的break和continue語句，作用有點類似於C和C++中的go

數據庫常見面試題（1）

過程屬性規則 ima isolation exec 執行過程 red ron 1. 超鍵、候選鍵、主鍵、和外鍵定義：超鍵（super key）：在關系中能惟一標識元素屬性的集稱為關系模式的超鍵。候選鍵：（Candidate Key）：不含有多余屬性的超鍵稱為候選

【JAVA秒會技術之秒殺面試官】JavaSE常見面試題（三）

mark error 對象創建事件算法 pool ret sync 數量 41..比較一下Java和JavaSciprt？答：其實Java和JavaScript最重要的區別是一個是靜態語言，一個是動態語言：（1）基於對象和面向對象：Java是一種真正的面向對象的語言

【JAVA秒會技術之秒殺面試官】JavaEE常見面試題（四）

裝配配置文件 action getpara 表達程序員錯誤頁面產生創建 46.Request對象的主要方法？答：（1）setAttribute(String name,Object)：設置名字為name的request的參數值（2）getAttribute(S

【JAVA秒會技術之秒殺面試官】JavaEE常見面試題（五）

內存溢出不可重復讀 cad struts2的 pro 單線程映射指定 log 51.事務的特性？答：①原子性(Atomicity) 指事務是一個不可分割的工作單位，事務中的操作要麽全都發生，要麽全不發生； ②一致性(Consistency) 事務前後數據的完成性必須

【JAVA秒會技術之秒殺面試官】JavaEE常見面試題（六）

行處理周期 3年 struts 處理 isp java對象 date 代碼 62.談一談你對Mybatis的理解？ MyBatis 本是apache的一個開源項目iBatis, 2010年這個項目由apache software foundation 遷移到了google

Java常見面試題（基礎）

明天夏天準備去面試一下關於人工智慧或者軟體開發的暑期實習生，所以提前準備一下，在網上看到一些很好的面試題，所以轉載方便日後觀看。轉自此處

PHP常見面試題（1）

面試能否成功最重要的固然是自身的硬實力，但同時，完全的準備也是十分必要的。所以，在此從網上搜集了部分常見面試題，早做準備。 1、echo、print()、print_r()的區別？這三個都可以做輸

Java集合常見面試題（一）

集合和陣列的區別： 1：陣列是固定長度的；集合可變長度的。 2：陣列可以儲存基本資料型別，也可以儲存引用資料型別；集合只能儲存引用資料型別。 3：陣列儲存的元素必須是同一個資料型別；集合儲存的物件可以是不同資料型別。 1.ArrayList和LinkedList的區別

軟體測試常見面試題（一）

1、開發犯低階錯誤怎麼辦？開發首先要規範好編碼，出低階錯時不要職責，內心指出錯誤。讓他們自己進行測試，反思找出錯誤。 2、你進行過那些測試，擅長什麼？我主要從事web測試，搭建環境，對程式進行整合測試、系統測試、迴歸測試。還有編寫測試用例，使用手冊，功

python爬蟲常見面試題（一）

前言　　之所以在這裡寫下python爬蟲常見面試題及解答，一是用作筆記，方便日後回憶；二是給自己一個和大家交流的機會，互相學習、進步，希望不正之處大家能給予指正；三是我也是網際網路寒潮下崗的那批人之一，為了找工作而做準備。一、題目部分 1、python中常用的資料結構有哪些？請簡要介紹一下。 2、

python爬蟲常見面試題（二）

前言　　之所以在這裡寫下python爬蟲常見面試題及解答，一是用作筆記，方便日後回憶；二是給自己一個和大家交流的機會，互相學習、進步，希望不正之處大家能給予指正；三是我也是網際網路寒潮下崗的那批人之一，為了找工作而做準備。一、題目部分 1、scrapy框架專題部分（很多面試都會涉及到這部分）（1

Java高階工程師常見面試題（七）-網路通訊

1. http是無狀態通訊，http的請求方式有哪些，可以自己定義新的請求方式麼。 HTTP是無狀態的，它的底層協議是由狀態的TCP，但是HTTP的一次完整協議動作，裡面是使用有狀態的TCP協議來完成的。而每次協議動作之間沒有任何關係。例如：第7次請求HTTP協議包，並不知

Java常見面試題（七）

好久沒有來更新了，今天正好有空更新一篇，不知道正在準備面試的小夥伴有沒有錯過啊？肯定是沒有，因為金三銀四還沒有來，今年開開心心過年，明年工作來一個大豐收！ 1、SpringMVC的工作流程? 使用者傳送請求至前端控制器DispatcherServlet DispatcherServlet收到請求

【JAVA秒會技術之秒殺面試官】JavaSE常見面試題（一）

【前言】別人都在你看不到的地方暗自努力，在你看得到的地方，他們也和你一樣顯得遊手好閒，和你一樣會抱怨，而只有你自己相信這些都是真的，最後，也只有你一個人繼續不思進取 …… 【下載】本人剛學習Java時總結的一些JavaSE常見面試題，偶爾在電腦中翻出，重新整理一下

機器學習與深度學習常見面試題（下）

相關推薦