機器學習-機器學習試題(一)

阿新 • • 發佈：2019-01-01

前言

在網上找的一些試題及延伸的一些問題，以選擇題為主，主要是關於基礎理論知識，同時給出自己聯想到的一些問題。當然基礎問題應當包含演算法本身的過程和某些推導過程。比如：LR、SVM的推導。

試題

試題1：已知座標軸中兩點A(2,−2)B(−1,2)，求這兩點的曼哈頓距離（L1距離）。

答案：7 。向量AB(-3,4),L1 是向量中非零元素的絕對值和。

問題延伸：機器學習演算法中哪些應用了L1，哪些應用了L2.

參考連結正則化技術

試題2：SVM中的核技巧（Kernal trick）的作用包括以下哪項？

A. 特徵升維
B. 特徵降維
C. 防止過擬合

答案：C

核技巧使用核函式將樣本從原特徵空間對映到更高維的空間，使得樣本在更高維的空間中線性可分。

問題延伸：SVM的核函式本質及推導過程。

試題3：在資料預處理階段，我們常常對數值特徵進行歸一化或標準化(standardization, normalization)處理。這種處理方式理論上不會對下列哪個模型產生很大影響？

A. k-Means
B. k-NN
C. 決策樹

答案：C

k-Means和k-NN都需要使用距離。而決策樹對於數值特徵，只在乎其大小排序，而非絕對大小。不管是標準化或者歸一化，都不會影響數值之間的相對大小。關於決策樹如何對數值特徵進行劃分

問題延伸：機器學習那些演算法是進行歸一化處理或標準化。

試題4：下面哪個情形不適合作為K-Means迭代終止的條件？

A. 前後兩次迭代中，每個聚類中的成員不變

B. 前後兩次迭代中，每個聚類中樣本的個數不變
C. 前後兩次迭代中，每個聚類的中心點不變

答案：B

A和C是等價的，因為中心點是聚類中成員各座標的均值

問題延伸：K-means的k值選擇及更新，迭代終止的兩個條件。

試題5：關於欠擬合（under-fitting），下面哪個說法是正確的？

A. 訓練誤差較大，測試誤差較小
B. 訓練誤差較小，測試誤差較大
C. 訓練誤差較大，測試誤差較大

答案：C

當欠擬合發生時，模型還沒有充分學習訓練集中基本有效資訊，導致訓練誤差太大。測試誤差也會較大，因為測試集中的基本資訊（分佈）是

與訓練集相一致的。

延伸問題：模型狀態？怎樣判定？工具是什麼？

機器學習-機器學習試題(一)

前言在網上找的一些試題及延伸的一些問題，以選擇題為主，主要是關於基礎理論知識，同時給出自己聯想到的一些問題。當然基礎問題應當包含演算法本身的過程和某些推導過程。比如：LR、SVM的推導。試題試題1：已知座標軸中兩點A(2,−2)B(−1,2)，求這兩點的曼哈頓距離（L1距離

中國mooc北京理工大學機器學習第一周（一）

lib odi pen 運行 numpy 聚類準則 ++ mooc 從今天開始跟著北理工的老師走一遍sklearn，在這裏做筆記。一、聚類 1、K-Means方法先貼代碼，所有數據的下載地址：http://pan.baidu.com/s/1hrO5NW4

中國mooc北京理工大學機器學習第二周（一）：分類

kmeans 方法輸入 nump arr mod 理工大學 each orm 一、K近鄰方法（KNeighborsClassifier）使用方法同kmeans方法，先構造分類器，再進行擬合。區別是Kmeans聚類是無監督學習，KNN是監督學習，因此需要劃分出訓練集和測試

【機器學習基石筆記】一、綜述

model 但是目標學習 imp 選擇處理定義條件課程定位：註重基礎、故事性機器學習定義： data - Algo - improve 機器學習使用條件 1、有優化的目標，可量化的。 2、規則不容易寫下來，需要學習。 3、要有數據一個可能的推薦

機器學習入門點滴（一）（待補充完整）

arr intro 統計 int ica nts 機器學習算法 .com 場景 Step1-知識準備： 1. 數學：線性代數，概率論和統計，高數 2. 程序語言：Matlab R 或 Python（只用於學習入門，不是實現的最佳語言） 3. 推薦書籍：選擇一到兩本公式較少、

《Python 機器學習》筆記（一）

環境成功設定相關 reward 能力學習一定的 env 賦予計算機學習數據的能力涵蓋：1.機器學習的一般概念2.機器學習方法的三種類型和基本術語3.成功構建機器學習系統所需的模塊機器學習的三種不同方法1.監督學習2.無監督學習3.強化學習通過監督學習對未來事件進行

《機器學習》學習筆記（一）：線性回歸、邏輯回歸

ros XA andrew ID learn 給定編程練習 size func 《機器學習》學習筆記（一）：線性回歸、邏輯回歸本筆記主要記錄學習《機器學習》的總結體會。如有理解不到位的地方，歡迎大家指出，我會努力改正。在學習《機器學習》時，我主要是

機器學習實戰教程（一）：線性回歸基礎篇（上）

學習 reg style spa 目標 pub auto 機器輸入一什麽是回歸？　　回歸的目的是預測數值型的目標值，最直接的辦法是依據輸入，寫入一個目標值的計算公式。　　假如你想預測小姐姐男友汽車的功率，可能會這麽計算：　　　　　　　　　　　　　　Ho

如何在未來的大數據和機器學習領域，獲得一份不錯的工作？

概率數據可視化 har 背景計算機 ros cat 自我提升 god 2018 年，AI 的發展腳步會加快，這一年將是 AI 技術重生和數據科學得以重新定義的一年。對於雄心勃勃的數據科學家來說，他們如何在與數據科學相關的工作市場中脫穎而出？2018 年會有足夠多的數據科

機器學習環境配置系列一之CUDA

arch developer 完成用戶 uname sed a10 是否安裝本文配置的環境為redhat6.9+cuda10.0+cudnn7.3.1+anaonda6.7+theano1.0.0+keras2.2.0+jupyter遠程，其中cuda的版本為10.0

Bobo老師機器學習筆記-資料歸一化

實現演算法： def normalizate_max_min(X): """ 利用最大和最小化方式進行歸一化，過一化的資料集中在【0， 1】 :param X: :return: """ np.asarray(X, dty

吳恩達老師機器學習筆記SVM（一）

時隔好久沒有再拾起機器學習了，今日抽空接著學今天是從最簡單的二維資料分類開始學習SVM~ （上圖為原始資料） SVM的代價函式這裡套用以前logistic迴歸的模板改一下下。。 load('ex6data1.mat'); theta=rand(3,1); [

機器學習之旅（一)

吳恩達教授的機器學習課程的第一週相關內容： 1、什麼是機器學習？答：機器學習的定義：A computer program is said to learn from experience E with respect to some class of tasks T and per

機器學習基礎概念（一）

“無監督學習”是指人們在獲得訓練的向量資料後在沒有標籤的情況下嘗試找出其內部蘊含關係的一種挖掘工作，這個過程中使用者除了可能要設定一些必要的超引數（ hyper-parameter）以外，不用對這些樣本做任何的標記甚至是過程干預； “有監督學習”與此不同，每一個樣本都有著明確的標籤，最

系統學習機器學習之總結（一）--常見分類演算法優缺點

主要是參考網上各種資源，做了整理。其實，這裡更多的是從基礎版本對比，真正使用的時候，看資料，看改進後的演算法。 1. 五大流派 ①符號主義：使用符號、規則和邏輯來表徵知識和進行邏輯推理，最喜歡的演算法是：規則和決策樹 ②貝葉斯派：獲取發生的可能性來進行概率推理，最喜歡的演算法是：樸素貝葉

機器學習-6（歸一化數值計算介紹）

特徵值太多了，但是每個特徵值有大有小，你怎麼去權衡50KG重和臂長1M以及投籃命中率百分之30呢？這個時候就需要我們去加一個係數了，這個特別像權重，你要保證的就是： x0+x1+x2+.....+xn=m d1*x0+d2*x1+.....+dn*xn=1 即&n

機器學習與深度學習常見面試題（下）

原創宣告：本文為SIGAI 原創文章，僅供個人學習使用，未經允許，不得轉載，不能用於商業目的。 1、為什麼隨機森林能降低方差？隨機森林的預測輸出值是多課決策樹的均值，如果有n個獨立同分布的隨機變數，它們的方差都為，

機器學習筆記（十一）： TensorFlow實戰三（MNIST數字識別問題）

1 - MNIST數字識別問題前面介紹了這樣用TensorFlow訓練一個神經網路模型和主要考慮的問題及解決這些問題的常用方法。下面我們用一個實際的問題來驗證之前的解決方法。我們使用的是MNIST手寫數字識別資料集。在很多深度學習教程中，這個資料集都會被當做一個案例。 1.1

跨平臺機器學習實踐小結（一）

一、問題來源：如何在node web服務下呼叫sklearn的模型結果來進行實時模型預測？二、問題分析： 1、sklearn的模型結果有幾種儲存方式：（1）pickle.dumps ，結果通過變數儲存在記憶體中附上pickle文件：https://docs.pytho

機器學習速成筆記（一）：主要術語

機器學習研究如何通過計算的方式，利用資料集來改善系統自身的效能。而深度學習是屬於機器學習的一個子分支。機器學習的通用的兩種型別：無監督學習：事先並沒有任務訓練資料的樣本，需要直接對資料進行建模型。監督學習：通過已經有的訓練樣本（即輸入資訊和對應的輸出）來訓練，得到一個

機器學習-機器學習試題(一)

前言

試題

相關推薦