機器學習（01）——機器學習簡介

阿新 • • 發佈：2020-01-04

最近在研究機器學習，隨手將學習的過程記錄下來，方面自己的學習與回顧

1. 機器學習是什麼？

機器學習(Machine Learning，ML)是專門研究計算機怎樣模擬或實現人類的學習行為，以獲取新的知識或技能，重新組織已有的知識結構使之不斷改善自身的效能的一門科學技術。

它使用計算機技術，應用微積分、概率論、統計學、逼近論、凸分析、演算法等多種不同的理論與學科，針對分析目標建立有針對性的資料模型，通過對過往歷史資料的學習（分類、迴歸、聚類等），完成基本演算法模型，並能通過後續持續的學習（資料輸入），在將雜亂的資料轉換（輸出）成有用資訊的同時，還能不斷優化改造自身。

2. 機器學習能解決什麼問題？

對於學習，人的學習過程，是通過觀察（輸入），根據過往經驗對觀察到的內容進行思考（處理），最後得出結論（輸出）的過程。

而機器學習是計算機利用已有的資料（一般是海量資料），得出了某種模型（演算法模型），並利用此模型預測未來的一種方法。

機器學習主要解決的問題可以歸納為：優化，預測，相關性。可以說，只要是涉及到優化，預測，個性化相關的問題，機器學習和深度學習都可以處理。

比如說，我們去買百香果吃，我們沒有買百香果的經驗，不知道那些是甜的那些是酸的，然後我們買了一大堆回來，有大的、小的、輕的、重的、紅的、紫的、白的、黃的、果皮光滑的、幹皺的...然後每一個都嘗一便，最後發現，百香果原來有兩大類，紫紅和黃白兩類，紫紅類的，果皮越深（越紫越黑）的越甜，黃白類的越黃越甜，跟大小無關，跟果皮的光滑度無關，而同樣大小，越重的果汁越多。黃白類的比紫紅類的果子甜度更高一些。那麼下次去買的時候，自然就懂得如何挑選了。

而機器學習跟買水果的過程類似，通過建模（對水果甜度的判斷）、設計策略（針對百香果不同的形狀特性）和演算法（品嚐百香果，得出酸甜結論），然後輸入大量資料（一大堆不同種類與特徵的百香果）進行訓練，最後學會判斷的過程（知道什麼型別的百香果比較甜）。模型建好後，就可以針對更多的資料進行測試並輸出結果（下次去買水果直接挑選學習後的水果型別，可以直接根據特徵判斷酸甜度），而這些結果也將不斷的修正模型（買回來後繼續品嚐，觀察酸甜度，繼續總結經驗，調整判斷方法），提升模型的準確率，更好的幫我們預測資料。

當前，機器學習廣泛應用於搜尋引擎、垃圾郵件處理、廣告推薦、資料探勘、影象識別、自然語言處理、生物特徵識別、醫學診斷、證券投資分析、DNA序列測序、語音和手寫識別、機器人運用等諸多領域，且應用的領域越來越廣泛。

3. 學習機器學習，需要具備什麼能力？

入門學習機器學習，只需要掌握下面這些能力：

瞭解一些數學基礎常識
掌握一門程式語言（最好是python）

對於入門來說，不一定要具備了所有的數學理論基礎才能開始，不具備這些知識並不代表不能靈活操作各個機器學習庫，只是有些演算法的理解會更困難。這些基礎理論在後續需要慢慢補上，它們關係到你在AI領域天花板的高度。而直接從實踐入手，會更容易理解演算法，對後續演算法的深入學習也有很大的幫助。

而想進階成為專家，除了需要加強數學基礎理論（高數、線性代數、統計學、概率論、資訊理論等數學基礎）的學習外，還需要學習大資料相關的知識與技能（如：Hadoop、HBase、Spark、kafka、Flume、Sqoop、Storm等）。然後根據發展方向，有針對性的學習NLP、神經網路等內容，往更多更專業的領域深入學習。

4. 怎麼學？

學習機器學習，需要分階段循序漸進學習，儘量不要一下子就深入演算法的推導中（除非你的數學理論非常紮實），不要試圖掌握所有的相關數學知識再開始學習，否則很容易從入門到崩潰，從崩潰到放棄。

對於初學者，建議從這幾方面來學習：

首先了解什麼是機器學習，以及機器學習的相關理論常識，對機器學習有個總體的瞭解與認識。
知道有哪些學習資源，瞭解這些資源哪些適合初學者。
大體瞭解機器學習的技術棧，瞭解涉及哪些知識體系，然後與自己的技術體系進行比較，瞭解學習方向，並做好長期學習的計劃與心態。
然後花些時間，瞭解機器學習的常用專業術語，大概瞭解這些專業名詞的意思，方便後續學習時更容易理解學習內容（不需要全部瞭解，只需要大體知道是什麼就行了，在學習機器學習的過程中會不斷的加深學習與理解）。
接著直接進入學習，可以學習《機器學習實戰》這本書，也可以學習ApacheCN分享出來的文字或視訊教程，學習各種機器學習演算法，先實踐再到理論。
入門後再根據所要用到的基礎理論或機器學習相關演算法和知識點，再針對性的學習，逐步提高。

參考資料：

https://www.cnblogs.com/subconscious/p/4107357.html

https://github.com/apachecn/AiLearning/blob/master/docs/ml/1.%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%9F%BA%E7%A1%8

機器學習（01）——機器學習簡介

1. 機器學習是什麼？

2. 機器學習能解決什麼問題？

3. 學習機器學習，需要具備什麼能力？

4. 怎麼學？

機器學習（01）——機器學習簡介

機器學習（四）機器學習與深度學習的實際應用整理

機器學習（三）深度學習的經典論文、程式碼、部落格文章

機器學習與深度學習系列連載：第二部分深度學習（七）深度學習技巧4（Deep learning tips- Dropout）

深度學習（1）--機器學習的概念

機器學習（十三）——機器學習中的矩陣方法（3）病態矩陣、協同過濾的ALS演算法（1）

機器學習與深度學習系列連載：第二部分深度學習（六）深度學習技巧3（Deep learning tips- Early stopping and Regularization）

C語言入門學習（01）——C程式設計環境的搭建及HelloWorld程式

MySQL學習（01）：基本指令入門

C#程式設計學習（01）：北斗時轉日曆時的小程式

SpringMVC學習（01）--前端控制器DispatcherServlet的初始化

C#學習（一）：C#簡介

SpringBootSecurity學習（01）網頁版登入入門介紹

Java學習（三）JSP學習1

python學習（五）字典學習

支援向量機學習（一）·統計學習方法

Hadoop-0.20.2原始碼學習（2）——原始碼學習環境搭建

web前端學習（二）html學習筆記部分（7）--web儲存2

web前端學習（二）html學習筆記部分（8）--伺服器推送事件3

web前端學習（二）html學習筆記部分（8）--服務器推送事件3

機器學習（01）——機器學習簡介

1. 機器學習是什麼？

2. 機器學習能解決什麼問題？

3. 學習機器學習，需要具備什麼能力？

4. 怎麼學？

相關推薦