BAT機器學習面試題1000題(311~315題)
《BAT機器學習面試1000題》系列作為國內首個AI題庫,囊括絕大部分機器學習和深度學習的筆試面試題、知識點,可以作為機器學習自測題,也可以當做查漏補缺的資料庫。七月線上AI題庫見“閱讀原文”(點進頁面掃碼下載APP)
311、下面哪些對「型別 1(Type-1)」和「型別 2(Type-2)」錯誤的描述是正確的?
A. 型別 1 通常稱之為假正類,型別 2 通常稱之為假負類。
B. 型別 2 通常稱之為假正類,型別 1 通常稱之為假負類。
C. 型別 1 錯誤通常在其是正確的情況下拒絕假設而出現。
答案為(A)和(C):在統計學假設測試中,I 類錯誤即錯誤地拒絕了正確的假設即假正類錯誤,II 類錯誤通常指錯誤地接受了錯誤的假設即假負類錯誤。
312、在下面的影象中,哪一個是多元共線(multi-collinear)特徵?
A. 圖 1 中的特徵
B. 圖 2 中的特徵
C. 圖 3 中的特徵
D. 圖 1、2 中的特徵
E. 圖 2、3 中的特徵
F. 圖 1、3 中的特徵
答案為(D):在圖 1 中,特徵之間有高度正相關,圖 2 中特徵有高度負相關。所以這兩個圖的特徵是多元共線特徵。
313、鑑別了多元共線特徵。那麼下一步可能的操作是什麼?
A. 移除兩個共線變數
B. 不移除兩個變數,而是移除一個
C. 移除相關變數可能會導致資訊損失,可以使用帶罰項的迴歸模型(如 ridge 或 lasso regression)。
答案為(B)和(C):因為移除兩個變數會損失一切資訊,所以我們只能移除一個特徵,或者也可以使用正則化演算法(如 L1 和 L2)。
314、給線性迴歸模型新增一個不重要的特徵可能會造成?
A. 增加 R-square
B. 減少 R-square
答案為(A):在給特徵空間添加了一個特徵後,不論特徵是重要還是不重要,R-square 通常會增加。
315、假定目標變數的類別非常不平衡,即主要類別佔據了訓練資料的 99%。現在你的模型在測試集上表現為 99% 的準確度。那麼下面哪一項表述是正確的?
A. 準確度並不適合於衡量不平衡類別問題
B. 準確度適合於衡量不平衡類別問題
C. 精確率和召回率適合於衡量不平衡類別問題
D. 精確率和召回率不適合于衡量不平衡類別問題
答案為(A)和(C)
往期題目:
提高學習效率,顛覆傳統刷題!