1. 程式人生 > >【機器學習】演算法面試知識點整理(持續更新中~)

【機器學習】演算法面試知識點整理(持續更新中~)

1、監督學習(SupervisedLearning):有類別標籤的學習,基於訓練樣本的輸入、輸出訓練得到最優模型,再使用該模型預測新輸入的輸出;

代表演算法:決策樹、樸素貝葉斯、邏輯迴歸、KNN、SVM、神經網路、隨機森林、AdaBoost、遺傳演算法;

2、半監督學習(Semi-supervisedLearning):同時使用大量的未標記資料和標記資料,進行模式識別工作;

代表演算法:self-training(自訓練演算法)、generative models生成模型、SVMs半監督支援向量機、graph-basedmethods圖論方法、 multiviewlearing多視角演算法等;

3、無監督學習

(UnsupervisedLearning):無類別標籤的學習,只給定樣本的輸入,自動從中尋找潛在的類別規則;

代表演算法:主成分分析方法PCA等,等距對映方法、區域性線性嵌入方法、拉普拉斯特徵對映方法、黑塞區域性線性嵌入方法、區域性切空間排列方法等;

4、HOG特徵:全稱Histogram of Oriented Gradient(方向梯度直方圖),由影象的區域性區域梯度方向直方圖構成特徵;

5、LBP特徵:全稱Local Binary Pattern(區域性二值模式),通過比較中心與鄰域畫素灰度值構成影象區域性紋理特徵;

6、Haar特徵:描述影象的灰度變化,由各模組的畫素差值構成特徵;

7、核函式

(Kernels):從低維空間到高維空間的對映,把低維空間中線性不可分的兩類點變成線性可分的;

8、SVM:全稱Support Vector Machine(支援向量機),在特徵空間上找到最佳的超平面使訓練集正負樣本的間隔最大;是解決二分類問題的有監督學習演算法,引入核方法後也可用來解決非線性問題;

9、Adaboost:全稱Adaptive Boosting(自適應增強),對同一個訓練集訓練不同的弱分類器,把這些弱分類器集合起來,構成一個更強的強分類器;

10、決策樹演算法Decision Tree處理訓練資料,構建決策樹模型,再對新資料進行分類;

11、隨機森林演算法Random Forest

使用基本單元(決策樹),通過整合學習將多棵樹整合;

12、樸素貝葉斯Naive Bayes根據事件的先驗知識描述事件的概率,對聯合概率建模來獲得目標概率值;

13、神經網路(Neural Networks):模仿動物神經網路行為特徵,將許多個單一“神經元”聯結在一起,通過調整內部大量節點之間相互連線的關係,進行分散式並行資訊處理。