1. 程式人生 > >機器學習小白入門①

機器學習小白入門①

  • 機器學習常用的理論分類:
  1. 傳統的監督學習
  2. 深度學習
  3. 強化學習
  • 建議按照上面列出的順序作為學習路線
  •  文字分類:

PS:其中特徵工程尤為重要,特徵決定了機器學習的上限,而機器學習只是在逼近這個上限 

  1. 字組成詞,詞才具有意義;而中文分詞將句子拆分為一個個的詞;
  2. 監督學習:
  3. 提高模型效能方法:①資料預處理 從本源出發②特徵工程 the key③機器學習演算法 就像找物件,適合最重要④模型整合
  4. anaconda官網下載地址 https://www.anaconda.com/download/

對數機率迴歸又名邏輯迴歸,名曰迴歸,實為分類,主要用於二分類問題(即輸出只有兩個類別)

  1. 誤差符合正態分佈,則誤差的均值為0
  2. 從數學角度的處理來說,數學處理過程上絕對值比平方和要 複雜得多的多的多。
  3. 噪聲資料,通俗點講就是沒啥屁用還礙事的資料。度孃的定義如是說,指資料中存在著錯誤或異常(偏離期望值)的資料,會對資料的分析造成干擾。負面影響eg:噪聲干擾過大,引起過擬合問題,即記住了噪音特徵,卻忽略了正常的輸入輸出關係。
  4. 過擬合:學習器把訓練樣本自身的一些特點當做了所有潛在樣本都會具有的一般性質,導致泛化效能下降。
  5. 欠擬合:對訓練樣本的一般性質都未學習好。
  6. 在概念角度上,最小二乘法等價於噪聲為高斯分佈的極大似然值(MLE Maximum Likelihood Estimate)
  7. 誤差:學習器的實際預測輸出與樣本的真實輸出之間的差異。
  8. 訓練誤差(又稱經驗誤差):學習器在訓練集上的誤差。
  9. 泛化誤差:在新樣本上的誤差。
  10. 向量不特意宣告的話預設是列向量。
  11. 對於正題小陌(雲裡霧裡)看完西瓜書之後,刷的視訊,趕腳還不錯 https://www.bilibili.com/video/av31989606?from=search&seid=1598298853277782473
  12.  演算法如同物件,無關優劣,適合最重要。各大演算法對眼的應用場景:

#持續更新ing