1. 程式人生 > >數據標註-人工智能高速路上的基石

數據標註-人工智能高速路上的基石

深度學習 com 類型 tel 語言 好的 名言 int 高速路

數據標註-人工智能高速路上的基石

中國科學技術大學博士袁嵐峰在不久前的文章中把中國科技在世界的地位大致分為五類。

我們本文中只引用第四類。

“如今世界科技的第四個格局:雙頭格局,一般是中美兩國遠遠高於其他國家。典型的例子有兩個,互聯網和人工智能。這兩個都是普遍被認為對於未來非常重要,最有想象空間的,值得我們仔細分析”。前四個格局有興趣的朋友可以自行搜索全文,這裏因為篇幅原因不做更多引用。

在這裏我們可以從一個科技工作者口中了解到一個這樣的事實:互聯網與人工智能在當今世界科技格局中,中國和美國是兩國獨大。同時,這兩個領域又是未來領域。

為什麽說是未來領域,互聯網的未來趨勢已經被時間很好的證明。從1969年美國的阿帕網以來,互聯網用了不到50年就徹底顛覆了過去幾百年來人們的生活習慣。

在這裏我們重要強調的是比互聯網年輕許多的人工智能。說到人工智能,首先我們先談談什麽是人工智能。

技術分享圖片

百度百科中是這麽定義人工智能的:人工智能(Artificial Intelligence),英文縮寫為AI。它是研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。

字面的意思有些生澀,那我們通過舉例來對AI進行一個簡單的解釋。

有天,我們開車在路上,突然出現了刮擦的交通事故,用現在的方式,我們需要:

  1. 發短信
  2. 打電話
  3. 報保險
  4. 定損

如果換做AI來幫我們簡化這個流程呢?

在不久的未來,我們手機裏可能都會有一款車輛定損APP,當出現交通事故的時候,我們只需要打開APP,掃描一下破損區域,機器就會自動識別出來我們破損區域是屬於什麽汽車部件,是什麽類型的損傷,自動定損,同時將定損結果反饋給相關保險公司,保險公司根據AI上傳的定損結果,自動劃賬到車主相關銀行賬號,可能整個流程不會超過1分鐘。

技術分享圖片

事實上,簡單來說就是我們把我們的理解和判斷,教給機器,讓機器代替我們進行判斷。

但是我們這裏要說的是隨著深度學習的不斷突破,未來的AI一定會越來越聰明。但是它的出現並不是為了取代人類,而是能讓人們極大限度的解放生產力。生產力的巨大提升,會改變未來的生產關系,會改變未來時代。

隨著一系列技術上的突破,人工智能在世界科技領域已經漸漸的駛進了高速車道。

中國老子有一句名言是:“九層之臺,起於累土”。

意思就是再高的樓臺都是由一筐一筐土堆積而成的,這就特別的強調了基礎的重要性。同樣,人工智能的發展離不開數據標註,數據標註在人工智能的高速路上,作為基石,成為了眾多重要環節之中的重中之重。

為什麽說數據標註是人工智能眾多重要環節的重中之重呢?這我們得從上篇中,人工智能的定義開始說起。

要想實現人工智能,我們需要把我們人類的理解和判斷教給計算機,讓計算機擁有我們人類般的識別能力。但是,讓計算機如何能識別人類的語言呢?

數據標註就是這樣出現了,數據標註就是我們人類用計算機能識別的方法,把需要計算機識別和分辨的圖片打上特征,讓計算機不斷的識別這些特征圖片,從而最終實現計算機能夠自主識別。

通俗點來講,比如我們想讓計算機知道什麽是汽車,那麽我們就得在有汽車的圖片中,把汽車用專業的標註工具標註出來。這裏的被標註軟件處理過的汽車就是圖片中的特征,計算機通過不斷的識別這些特征圖片。最終結果就是,計算機通過大量的特征圖片的學習,最終能夠自主的識別特征物品。

所以說,如果人工智能是一個天賦異稟的孩子,那麽數據標註就是它的啟蒙老師,在傳授的過程中,老師講的越細致,越有耐心,那麽孩子成長的也就越穩健。同樣,換個角度,如果說人工智能是一條高速公路,那麽數據標註就是高速公路的基石,基石越穩固,質量越過硬,那麽就會使用起來就會越放心,越長久。

像馬雲先生在2018世界人工智能大會上所說一樣:蒸汽機釋放了人的體力,但是蒸汽機並不是模仿人的體力,汽車比人跑得快,但是汽車並不是模仿人的雙腿。未來的計算會釋放人的腦力,但是計算機不是按照人腦一樣去思考,計算機機器必須要有自己的方式去思考。

技術分享圖片

那麽如何能讓計算機形成一套自主的思考體系呢?這是一個復雜的過程,但是不論是多復雜的架構,數據標註永遠是體系中的養分,通過不斷的改變標註內容來適應不斷強大的計算機。

了解更多內容請進入:http://www.awkvector.com/

數據標註-人工智能高速路上的基石