1. 程式人生 > >python機器學習 第一章

python機器學習 第一章

世紀 指導 處理 任務 開發 輸出 dash 相似性 預測

1.1機器學習在20世紀下半葉演變為人工智能(AI)的一個分支,它涉及從數據中通過自我學習獲得算法以進行預測。

1.2三種類型的機器學習:

  有監督,無監督,強化

技術分享圖片

1.2.1用有監督學習預測

  有監督學習:從有標簽的訓練數據中學習模型,以便對未知或未來的數據做出預測。“監督”一詞指的是已經知道樣本所需要的輸出信號或標簽。總之,有監督學習以帶標簽的訓練數據訓練模型,進一步將新數據加上標簽。

  帶有離散分類標簽的有監督學習——分類任務。

  結果是連續的值——回歸

分類是有監督學習的一個分支,根據已知的觀測結果來觀測新的樣本分類標簽。這些分類標簽是離散的無序值。

   回歸分析是對連續結果的預測。回歸分析包括一些預測變量和一個連續響應變量,試圖尋找能夠預測結果與變量之間的關系,比如在一個二維坐標系中,預測變量x,相應變量y,對出現的數據進行擬合(謀求樣本點和擬合線平均距離最小)。

1.2.2用強化學習解決交互問題

  強化學習的目標是開發系統或代理,通過它們與環境的交互來提高預測性能 在本書強化學習不是重點

1.2.3用無監督學習發現隱藏結構

  在有監督學習中,事先知道正確的答案;在強化學習中,定義了代理對特定動作的獎勵,然而無監督學習處理的是無標簽的未知數據。用無監督學習技術,可以在沒有已知結果變量或獎勵函數的指導下,探索數據結構以提取有用信息。

  1.2.3.1尋找聚類的子集

  聚類是探索性的數據分析技術,可以在事先不了解組員的情況下,將信息分成有意義的族群。為在分析過程中出現的每個群定義一組對象,它們之間都有一定的相似性,但與其他群中對象的差異更大。

  1.2.3.2通過降維壓縮數據

  無監督降維是特征處理中數據去噪的一種常用方法,它也降低了某些算法對預測性能的要求,在保留大部分信息的同時將數據壓縮到較小的維數空間上。

1.3相關約定

用矩陣表示數據集時,每一行代表一個樣本,每一列代表一個特征。 一個150*4的矩陣代表了150個樣本,每個樣本有4個標簽

1.4構建機器學習系統的路線圖

技術分享圖片

python機器學習 第一章