1. 程式人生 > >理解五個基本概念,讓你更像機器學習專家

理解五個基本概念,讓你更像機器學習專家

e0317a709b0d1cb51528608631ad174465c7d6b4

大多數人可能對機器學習有點恐懼或困惑。 腦子中會有它到底是什麼,它有什麼發展方向,我現在可以通過它掙錢嗎等等這樣的問題。

這些問題的提出都是有依據的。事實上,你可能沒有意識到自己其實多年來一直在訓練機器學習模型。你看過蘋果手機或者是Facebook上的照片吧? 你知道它如何向你展示一組面孔並要求你識別它們嗎?其實,通過標記這些照片,你正在訓練面部識別模型去識別新面孔。恭喜你,現在可以說你有訓練機器學習模型的經驗了!但在此之前,請閱讀這些機器學習基礎知識,以便你可以準確回答任何後續問題。

1)機器學習可以預測

如果你只是在圖片中標記朋友的面孔,那就不是在用機器學習模型。如果你上傳了一張新照片系統馬上告訴你每個人是誰,那你就是應用了機器學習模型。機器學習的主要意義在於根據圖案模型和經過訓練的其他因素來預測事物。它可以預測任何事物,如要基於地理位置和臥室數量預測房價,基於一年中的時間和天氣的變化預測航班是否會延誤,依據圖片中的人物特點進行人像識別等等。

2)機器學習需要訓練

你必須告訴機器學習模型它試圖預測的是什麼。想想一個孩子是如何學習的,他們第一次看到香蕉,他們不知道它是什麼。然後你告訴他們這是一個香蕉。下次他們看到另一個,他們會把它識別為香蕉,機器學習就是以類似的方式工作。你可以儘可能多地展示香蕉的照片,告訴它這是香蕉,然後用未經訓練的香蕉圖片進行測試。但這是一個過度的簡化的方法,因為整個過程遺漏了告訴它什麼不是香蕉的部分,除此之外還要給它展示不同種類不同顏色、不同角度的香蕉圖片等等。

3)達到80%的準確度就可以認為是成功的

我們還沒有達到通過機器學習平臺識別圖片中的香蕉達到100%的準確率技術的地步,但也沒關係,事實證明,人類去識別也不是100%準確。業界的潛規則是達到80%準確度的模型就是成功的。大家可以思考一下,在你收藏的圖片中正確識別800,000張是非常有用的,雖然可能還有錯誤的200,000張,但這已經節省了80%的時間。毋庸置疑,這是非常有價值的。假如我可以用它使你的生產力提高如此之多,你肯定會付我很多錢。而事實證明我可以用機器學習提高你的生產力。(2018年更新:80%規則改為90%規則。)

4)機器學習不同於AI,深度學習或神經網路

人們經常隨意丟擲以上這些術語,聽起來像專家,但其中有很大差異。

AI-人工智慧是指在完成特定任務時與人類一樣好(或優於人類)的計算機。它也可以指一個可以根據大量輸入做出決策的機器人,與終結者或C3PO不同。它是一個非常廣泛的術語,不是很有特指性。

ML-機器學習是實現AI的一種方法。就是通過解析資料集對某事做出預測。ML平臺可以通過許多不同的方式執行訓練集來預測事物。

NL-神經網路是實現機器學習模型預測事物的方式之一。神經網路的工作有點像人的大腦,通過大量的訓練來調整自己,以瞭解香蕉應該是什麼樣子。這個過程建立了非常深的節點層。

5)在AI變得有自我意識之前,我們還有很長的路要走

dac418d02b31aff0c43a5b66936306fcb1a57239

 

    我並不擔心機器學習接管地球。主要是因為如果你曾構建過一個機器學習模型,就會明白它需要依賴你來告訴它究竟該做什麼。即使你給出明確的指示,它通常也會出錯。你必須對這些體系非常清晰明確,讓它突然變化的可能性降到最低。即使是一個顯示帶有單詞的框的簡單網頁,也需要你準確地告訴它該框出現的位置,形狀,顏色,如何在不同的瀏覽器上工作,如何在不同的裝置上正確顯示等等。

 

原文連結
本文為雲棲社群原創內容,未經允許不得轉載。