騰訊優圖實驗室專家寫給2029的信:計算機視覺AI技術的爆點在哪裡?
《中國企業家》記者 崔鵬採訪整理
文| 騰訊傑出科學家、騰訊優圖實驗室負責人 賈佳亞;騰訊優圖實驗室總監 戴宇榮博士、鄭冶楓博士
“在數不清的視覺AI應用中,我們認為未來技術的爆發點可能來自三個方面:資訊的整合和提取、醫療和自動駕駛。”
在迷霧重重、混沌不明的當下,市場中的每一個理性人都需要放長眼量,將錨拋在時間之河中較遠的地方,以未來丈量現在,才能站立得更堅實安穩。《中國企業家》組織9位企業家、科學家、經濟學家及藝術家,請他們每人寫下一封給2029年的信,預測他們眼中10年後的世界,希望能對讀者有所裨益。

(圖片來源:中企相簿)
近年來,計算機視覺AI技術發展迅速,尤其是人工智慧的引入大大提升了演算法的能力和實用性。在數不清的視覺AI應用中,我們認為未來技術的爆發點可能來自三個方面:資訊的整合和提取、醫療和自動駕駛。騰訊優圖實驗室的AI技術佈局也可大致分為上述的三個模組。
資訊的整合和提取,主要指內容分析,包括人物識別、行為分析、場景識別、物體檢測、語義分割等能夠從豐富的影象或視訊中提取有意義和結構化的資訊,結合落地場景的應用,產生有價值的資料,給予使用者或消費者精準的建議。這個領域在近幾年進展迅速。舉例來說,通過分析使用者的點選或搜尋行為,建立使用者畫像,讓內容服務平臺能夠更精準地推薦使用者感興趣的內容。這是Google、Facebook等大公司正在做的事情。在視覺AI技術成熟前,他們的使用者畫像主要以文字搜尋記錄的分析為主。但隨著視覺AI技術的發展,往後將會有更多的使用者行為是從多媒體內容直接提取。並且,資訊的整合和提取不會只侷限於線上的行為。在大資料和5G普及的未來,將會產生大量的線下資料。通過提煉線下的資料,能夠更有效地分析人們的行為,小至商品推薦,大至城市規劃,均會使用視覺AI技術,讓人們的生活更方便、舒適和安全。
醫療AI的宗旨在於輔助診斷,在人口眾多、醫師資源分配不均的時代,減少醫生的重複性勞動,幫助基層疾病篩查的覆蓋。臨床上,疾病治療秉持的觀點是:早診斷、早治療、疾病篩查、及時就醫以及精準微創型治療對整個社會以及人類醫療水平的提高有著前所未有的重大意義。未來十年,智慧問診、智慧掛號指引、醫療影像上的自動篩查,如X光肺炎自動檢測、心臟影像結構自動分析等將會大量減少醫生的工作,讓醫生更專注解決和處理危疾病人的需求。並且,醫療AI有望實現大部分疾病初篩普及,大資料化以及智慧分析有望改變傳統就醫繁雜的過程,虛擬手術的發展增加醫師手術經驗,智慧手術機器人實現更多疾病的精準微創手術治療。
自動駕駛是在未來十年必定會到來的技術。當中核心需要解決的問題在於環境識別。目前,在自動駕駛的落地測試中,因為環境識別的錯誤產生的交通意外,佔了90%以上。簡單地解釋一下,如果自動駕駛是發生在遊戲世界,所有環境的資料都能夠精準地反饋到負責車控的AI,而AI只需要做決策,那麼在這個問題之上,AI的決策能力絕對在人類之上。這個從AlphaGo戰勝人類的案例中可以看出,在完全的封閉環境之下,AI的決策能力已經超越人類。而自動駕駛目前還處於測試階段的原因,是因為對環境資訊的不完全理解,因而做成決策錯誤。而解決這個環境識別的問題,是會隨著在路上行車測試資料的不斷增加而趨於完美的。這樣考慮下來,自動駕駛就是一個必定會到來的技術。同時,基於自動駕駛所產生的應用,為人們帶來生活的便利,將會越來越多。
未來十年,首先確定無疑的是,AI演算法的各項指標會越來越高,計算機視覺的演算法也會在實用的道路上越走越深入:更貼近使用場景、效果更精準。軟硬體的進步讓基於AI的視覺演算法不再受限於特定的計算硬體,而且將成為計算裝置看懂世界的常用工具。如今的“多媒體計算機”能夠記錄並播放多種媒體,未來的計算機將能夠讀懂多種媒體資訊的含義。
計算機視覺AI技術的發展也勢必會直接影響我們衣食住行的方方面面。
暢想一下,2029年,商店自動推斷出顧客的體型、膚色、年齡,進而推薦合適的穿衣搭配;吃東西之前,自動幫你判斷新鮮程度、營養成分、推薦健康的膳食搭配;智慧家居進入千家萬戶,語音、手勢可以自由地控制家電,智慧安防攝像頭幫你照料家中小孩的活動;在醫療方面,疾病檢查過程簡便化,基層醫療裝置更加完善,少數醫護人員就可建立疾病篩查點;對某些疾病,行動式的成像裝置湧現,傻瓜式的操作、篩查過程進入尋常百姓家,讓患者實現自我篩查。十年後的就醫,我們不用再為“肚子疼”應該掛哪個科室而煩惱,智慧對話分析助手可以通過簡單的對話幫患者確定疾病範圍、選擇科室、做出最佳的檢查時間、就醫時間安排,簡化就醫流程。智慧手術機器人變得更加智慧化、微細化,術後癒合快,減少手術帶來的痛苦。
無人駕駛汽車的普及,將會大量釋放物流業的人力成本,讓BtoC的生意更容易和快捷,物價將會因為人力成本的減少變得更合理。泊車時將不再需要忙於尋找車位,長途汽車旅遊將會有更多的休息時間,無人計程車讓人們能夠即叫即走,女士晚上叫車將會更安全,城市交通也會因為更好的路線規劃而減少阻塞。
AI將賦予計算機理解世界的能力,計算機能更好地幫助人類分析規劃,作出決策。當然,計算機視覺AI技術的想象空間無限大。但是從技術研究到實際落地應用還有很長的路要走,這也是所有相關研究人員努力的方向和願景。