1. 程式人生 > >Coursera吳恩達機器學習教程筆記(一)

Coursera吳恩達機器學習教程筆記(一)

    人工智慧行業如火如荼,想要入門人工智慧,吳恩達老師的機器學習課程絕對是不二之選(當然,這不是我說的,是廣大網友共同認為的)

    教程的地址連結:

    有的同學可能進不去這個網站,解決辦法參照如下連結:

    這個辦法本人親測有效,因為我看的時候也打不開(囧!!)

    要是這個辦法也不行,那就只能退而且其次,請直接移步到bilibili網站上去看吧~

    言歸正傳,在這門課程的開頭,吳老師舉了很多個機器學習的例子,比如垃圾郵件篩選,人臉識別,推薦系統以及他的直升機自主飛行實驗,舉了這麼多個例子,其實就是想說為啥需要機器學習?? 答:因為有些問題依靠傳統的程式設計方法很難解決或者沒法解決。比如音樂推薦系統,面對海量使用者,不可能針對每個使用者都寫一個適合他們喜好的音樂推薦程式,所以就需要機器學習。那大概要怎麼辦呢?就是通過獲取每個使用者的音樂選擇資訊,然後給音樂貼上標籤,告訴計算機這是啥型別的音樂,通過不斷滴告訴計算機每個使用者喜歡的音樂型別是什麼,計算機就可以根據這些經驗,來給使用者自動推薦他們喜歡的音樂。

    那麼上面的描述就已經包含了機器學習的定義了,機器學習就是通過給計算機輸入某個任務的經驗,來讓計算機更好地完成該任務,音樂推薦就是任務,獲取使用者的音樂型別資訊就是經驗,最終計算機通過得到的經驗更好的完成音樂推薦任務。

    接著,吳老師又講了監督學習,他舉了兩個例子,一個是房價預測,另一個是腫瘤性質判定。第一個案例就是說給定一些房房子的每平米價格,然後讓你根據這些資料判定一個房子每平米大約能賣多少錢,這其實有點像初中學習的求取函式式問題,只不過那時候只有幾個點,函式式就那麼幾個,現在不一樣了,函式式很多,用這個好像可以,用那個好像也行。就像他視訊課圖裡畫的:

    

    用直線可以描述,用曲線也可以描述,得到的結果也不大一樣,所以給這個問題起一個比較高大上的名字,迴歸問題。這類問題的特點就是給定一些正確的資料作為訓練集,然後用這些資料集擬合出來一個公式,然後用這個公式再去預測未知的問題,比如房價,股票價格等等

    第二個案例是判定腫瘤性質的,就是根據腫瘤的大小來判定腫瘤是惡性還是良性,直接看圖吧~


    這個圖中藍色的是良性,紅色的是惡性,粉色的是要咱們根據這些資料來預測的,我的預測結果是可能良性也可能惡性(感覺和沒說一樣......)。的確,只根據這麼一個特徵的確不好判斷,所以吳老師又給出了其他特徵,如下圖所示:

    

    在這個圖裡,又加入了患者的年齡特徵,然後又重新給出了資料集,然後一刀切,下面的就是良性,上面的就是惡性,雖然還有例外,但是也比較真實了。如果還想讓預測結果更加準確,那就得加更多的特徵(比如腫瘤形狀),用更好的資料集來訓練了。更準確的說,這其實是個分類問題,同案例一一樣,用正確的資料來訓練,只不過把預測結果分成了兩類(當然,實際問題可能不止兩類),不像案例一中的房價有好多情況。

    總而言之,監督學習就是用正確、已知、既定事實的資料來給未知的問題做預測,其中迴歸問題得到的結果有很多,類似於函式式的輸出,輸出是連續的,而分類問題的結果就那麼幾種,輸出結果是離散的。

    然後呢,吳老師又講了無監督學習,無監督學習的概念就是給出的資料都沒有任何特徵,需要使用某種聚類演算法使資料能自動分成多類。就像下面這張圖


圖裡面的資料表面上看都是一樣的,但是通過聚類演算法,可以將上述資料分成兩類,如下所示

                       

    也就是說,聚類演算法的作用就是將一堆事先沒有任何特徵的資料做分類。還拿音樂推薦系統為例,當得到一堆使用者資料之後,使用通過使用者常聽的音樂對使用者進行聚類,然後就可以知道某些使用者喜歡哪種型別的音樂,然後將這些使用者劃分為一類,最後由計算機向該型別使用者推薦對應的音樂

    還有一個應用就是檢視社交軟體上使用者的常用聯絡人,通過聊天頻度對使用者進行聚類,然後就可以知道哪些人是你的常用聯絡人。類似的例子還有很多,大家自行谷歌百度。當然,聚類只是無監督學習的一種。非聚類的無監督學習的一個很經典的例子就是雞尾酒會演算法,就是讓機器在一片嘈雜的環境中辨別或是提取出某種特定的聲音

    所以,無監督學習就是就是通過演算法並根據資料中的變數關係來將資料進行分類

    到這裡呢,lecture one就講完了。

    課件在這裡:課件連結

    密碼:3pme

    如果連線失效,請在下方留言告訴我