1. 程式人生 > >人工智慧、機器學習與深度學習

人工智慧、機器學習與深度學習

參考書籍《白話大資料機器學習》高揚等

人工智慧是一個較寬泛的概念,旨在通過計算機實現類似人類的智慧。

機器學習是解決人工智慧問題中的一個重要方法。

深度學習是機器學習的一個分支,它在很多領域突破了傳統機器學習的瓶頸,將人工智慧推向了一個新高潮。

卡內基梅隆大學的Tom MichaelMitchell教授在《Machine learning》書中對機器學習給出比較專業的定義,業界也比較認可。定義為“如果一個程式可以在任務T上,隨著經驗E的增加,效果P也可以隨之增加,則稱這個程式可以從經驗中學習”,通俗的將,就是計算機通過對任務上的歷史資料(或叫訓練資料)的學習,總結歸納出潛在規律,完成相應的任務;一般情況下,當歷史資料(訓練資料)越多,積累學習的經驗規律就越多越成熟,會提高完成任務的成功率。


大部分情況下,在訓練資料達到一定程度之前,越多的訓練資料可使機器學習演算法的預測精度越高。之所以說是大多數情況下,是由於機器學習演算法的效果除了依賴於訓練資料,還依賴於從資料中提取的特徵。如果資料特徵提取不正確,那麼再多的訓練資料也不能提高預測精度。

目前傳統機器學習提取特徵主要是人工提取,受人為影響較大。特徵不同,則同樣資料的表達方式不同,造成最後預測精度也有較大差異。人工方式去抽取實體或資料特徵,往往是根據經驗,無法很好的去抽取合適的特徵,那麼有沒有自動抽取實體或資料特徵的呢?

深度學習解決的核心問題之一就是自動的將簡單的特徵組合成更復雜的特徵,並且使用這些組合特徵解決問題。深度學習可以從資料中抽取更加複雜的特徵表示式,使的最後一步權重學習變得更加簡單且高效。


大部分情況下,在訓練資料達到一定程度之前,越多的訓練資料可使機器學習演算法的預測精度越高。之所以說是大多數情況下,是由於機器學習演算法的效果除了依賴於訓練資料,還依賴於從資料中提取的特徵。如果資料特徵提取不正確,那麼再多的訓練資料也不能提高預測精度。

目前傳統機器學習提取特徵主要是人工提取,受人為影響較大。特徵不同,則同樣資料的表達方式不同,造成最後預測精度也有較大差異。人工方式去抽取實體或資料特徵,往往是根據經驗,無法很好的去抽取合適的特徵,那麼有沒有自動抽取實體或資料特徵的呢?

深度學習解決的核心問題之一就是自動的將簡單的特徵組合成更復雜的特徵,並且使用這些組合特徵解決問題。深度學習可以從資料中抽取更加複雜的特徵表示式,使的最後一步權重學習變得更加簡單且高效。