人工智慧靠什麼走向大眾
【科技隨筆】
隨著人臉識別、語音識別和自動駕駛日益成為關注焦點,人工智慧(AI)與社會、人類生活融合程度正在快速演進。
其實早在1956年,人工智慧這個“術語”就被正式提出。但在有限且昂貴的計算能力、已有計算方法存在缺陷、缺乏資料量這些無法克服的基礎性障礙面前,“模擬人類大腦”顯得非常遙遠。此後,一直到20世紀80年代初,隨著一類名為“專家系統”的AI程式開始為全世界的公司所採用,人工智慧才興起了第二次熱潮。各國開始投入大量資金,例如日本經濟產業省雄心勃勃旨在打造“第五代計算機”的研究計劃,目標是製造出能夠與人對話、翻譯語言、解釋影象,並且能像人一樣推理的機器。80年代後期,產業界對人工智慧系統投入巨大但只產生有限的應用產生質疑,人工智慧的泡沫逐漸破裂,投入大幅消減,人工智慧再一次步入寒冬。
那麼,人工智慧到底將靠什麼走向大眾?筆者認為,視覺AI技術將是發展方向。
對人類而言,70%到80%的資訊獲取來自視覺。對人工智慧來說,視覺AI也被視為目前最具應用價值的AI技術。它能夠讓機器具備“從識人知物到辨識萬物”的能力,從而看懂、理解這個世界,幫助我們在生產和工作中,提升處理資訊的效率。
簡單來說,視覺AI就是研究如何讓機器會“看”,即用攝影機和電腦代替人眼對影象進行特徵提取和分析,並由此訓練模型對新的影象資料進行檢測、識別等任務,建立能夠從影象或者多模態資料中獲取“資訊”的人工智慧系統。
源於深度學習的突破,視覺AI的識別能力突飛猛進,2012年的兩個轟動事件,更被視為視覺AI的發展拐點。當時,由多倫多大學Geoffrey Hinton領導的團隊,在一項名為ImageNet的影象識別競賽中,利用深度學習和GPU的強大計算能力,將錯誤率降低了10%,震驚學術界,因為之前這項錯誤率每年只會降低1%—2%。
同年,“谷歌大腦之父”吳恩達帶領團隊,利用10億引數的神經網路,在沒有任何先驗知識的情況下,僅僅通過觀看無標註的YouTube的視訊,創造了一套貓臉識別系統——從海量照片裡自動識別出貓臉。
視覺AI迅速成為人工智慧領域最重量級的研究領域,源自於其在安防、醫療、無人駕駛等多個領域的應用前景。
例如,在安防領域,視覺AI技術可進行人群分析、逃犯追捕,可通過城市中成千上萬條路的攝像頭對目標人群進行鎖定與篩查,並做到實時告警,助力安防效率的提升;在手機領域,AI可提供刷臉解鎖、刷臉支付等更加安全和便捷的體驗,還可自動為面部美顏省去後期修圖的時間;在自動駕駛領域,AI技術可以通過攝像頭獲取的影象,對車體的周圍環境進行識別和分析,輔助做出精準的路徑規劃。
在眾多的視覺AI應用場景中,AI醫學影象分析是近年來熱度極高的一個細分領域。這主要得益於醫院資訊數字化建設的不斷提速,以醫學影像為核心的大資料不斷豐富,為AI在醫療領域的發展提供了充足的養料。與此同時,優質醫療資源的稀缺和分配不均也不斷催生著社會對人工智慧的需求。
當下AI+醫療的紅火,對推動這個行業的發展起到了不可磨滅的作用,還有豐富的應用場景和海量的機會等待挖掘,例如個性化醫療、可穿戴智慧醫療裝置的實時監測與分析等。
放眼未來,更多的應用前景都將貼上視覺AI的標籤。比如,人臉識別技術有望在更多的物聯網終端裝置上應用,讓安全便捷的身份認證無處不在,提升生活體驗;在AI+工業領域,工業機器人、物流機器人將更多替代傳統勞動力;在AI+文化領域,基於AI的增強現實技術,可以將古代文物、古代場景生動復原得以假亂真;在AI+教育領域,利用視覺技術實現學生的注意力管理、跟蹤學生的知識點掌握,實現真正的因材施教。
當然,AI掀起的新一輪產業浪潮不過短短几年,技術上需要持續不斷的突破創新,行業需要不斷的深耕和挖掘,大眾也需要對其給予足夠的耐心。