人工智慧研究員:你所想象的一切離我們並不遙遠
(圖片來源:全景視覺)
經濟觀察網 記者 饒賢君朱茵飾演的黃蓉在經過AI(人工智慧)技術處理後,被“換臉”成了楊冪,面部微表情、五官的運動看起來毫無破綻,這個在社交網路上引發了熱議的“高科技”話題,在之江實驗室人工智慧研究院副研究員單海軍博士看來,其實只是AI現有技術的冰山一角。
如果運用更先進成熟的AI技術,這段視訊其實可以更具“迷惑性”,單海軍稱,:“現有的技術完全可以做到用楊冪的音色、音調,完美的地配合視訊中的嘴型、臺詞,有些沒看過原作的人可能根本分辨不出來,‘咦,楊冪還演過這個?’。”
換臉的物件並不侷限於明星、名人,AI技術甚至能“無中生有”,創造一個並不存在的面部,而神奇之處在於,其生動的表情和五官,能夠讓普通人用肉眼完全無法分辨出這其實是一個虛擬的“人造臉”。
諸如此類,AI技術的普及和日趨成熟,正在讓原本想象中的一切逐漸貼近我們的生活,人臉識別、虹膜認證、實時翻譯、智慧家居等等AI技術的應用以顛覆性的姿態更新著人們的認知,而在這個充滿想象力和科技感的行業裡,每一個從業者都是時代變革的見證者。
“充滿想象力”的職業
和電影裡白大褂、一臉嚴肅的科研人員不同,一身休閒西裝的單海軍坐在經濟觀察報記者對面時,談吐幽默、表情輕鬆,想到一些有趣的回答時,時常會爽朗的地笑出聲來。
進入人工智慧這個行業,對於單海軍來說是水到渠成的事,無論是本科學習的自動化專業機械自動化管理,還是美國明尼蘇達大學博士生涯對腦機介面的研究,單海軍始終在和人工智慧打交道,“其實大學裡學的東西都是課本上的偏理論,比較很枯燥、很抽象,沒有那些很酷很炫的東西,但是到了後來真正入了這行,把以前學的那些枯燥的理論、演算法在實踐中和產品結合起來了,有時候開始有些興奮,原來當時學的都是最前沿的東西。”
2012年,單海軍開始接觸人工智慧的“機器學習”,2014年,研究更深一步的人工智慧“深度學習”,並真正開始進入人工智慧行業,“現在,最前沿的風口技術已經是我們所說的‘圖神經網路’,人工智慧領域的技術革新實在太快,每兩三年基本上每幾年就是一個大的顛覆。”
從機器學習到深度學習,儘管名稱上看起來變化不大,實際的改變是革命性的,“就拿人臉識別舉例來說,機器學習時代是半自動化的,就是我給AI一千張面孔人臉圖片,需要然後人工進行資料處理和特徵提取設定好條件,即告訴計算機模型AI,人臉之間最大的臉部特徵區別是哪些每個面孔的五官都有哪裡不同,這樣,AI才能完成對這一千張面孔人臉的辨認,正確率大概在70%-80%之間,而深度學習的進步在於,它是端到端全自動化的, 同樣給機器一千張面孔,AI演算法模型可以通過海量的資料資訊的訓練和學習,自己產生相應的識別能力,而且最好的模型識別正確率已經可以達到99%以上。”
新的“圖神經網路”技術則為AI帶來了推理能力,也就是說,在具備人臉識別這樣的感知能力之外,還具備推理認知能力,辨認你的臉之後還能判斷出你的性別、職業等資訊,推理能力跳出了原本的資訊束縛同樣獲取了一千張面孔的資料之後,AI可以辨認出這一千張面孔之外的新面孔,跳出了原本的資訊束縛。這其中,每一個階段的技術革新,對於傳統的應用技術都是顛覆性的,甚至是超越想象的。
“比如說智慧醫療,我們現在的技術可以達到的是,通過海量的病例影像錄入,AI能夠輔助醫生判定患者的病灶在哪裡,準確的地判斷病情,。更進一步的是,現在已經有能夠做手術的機器人達芬奇,或許有一天,機器人幫我們看完病,然後幫我們做手術,醫生只需要完全旁觀,這些都是完全有可能實現的,我們這個職業永遠充滿想象力。”
在這樣一個日新月異、充滿想象的行業裡,單海軍和其他所有的AI行業從業者一樣,必須時刻保證自己的知識庫存能夠跟上技術水平的發展。
單海軍目前主攻的課題是“跨媒體智慧研究”,簡單來說,就是對人工智慧目前三大領域——計算機視覺、語音識別及自然語言處理的“融合”。
這些高大上的專業名詞其實很好理解,計算機視覺即指AI可以通過攝像頭影象或視訊理解,辨認出你是誰,你在幹什麼;語音識別則可以判斷誰在說話,說了什麼,並轉為文字;而自然語言處理則是指給AI一段文字,它他可以理解這段文字的意思,甚至為這段文字提煉出摘要。這些技術都有對映到現實中的應用,如機場的人臉識別、科大訊飛的語音翻譯、今日頭條的AI新聞。
單海軍要做的,就是將這些領域跨“感官”資訊融結合起來,使得AI對環境的感知和認知表現得的更加貼近人類,“比如我們坐在這裡喝茶、採訪,一個人類走進房間,他憑藉視覺、聽覺以及對我們對話的理解,就知道,‘哦,你們在採訪’,現在我們希望,把一個AI放在這樣的場景裡,它也能明白我們在幹什麼。”人類聽起來能簡單理解的事務的理解能力背後,但需要AI需要具備極其複雜的學習、計算、推理能力才能理解。
對於目前的AI技術而言,要達成這樣的目標或許還有些距離,單海軍認為,“其實從AI的發展階段來講,它目前還是個嬰兒,學術一點的叫法就是弱人工智慧時代,它自己其實是無意識無沒有智慧的。”
夢想照進現實
即使是這樣一個沒有智慧的“嬰兒”,對於社會帶來的改變已經足以稱得上顛覆。
在普通人對人工智慧的理解還短暫停留於打敗李世石的AlphaGo、電影電視中的瓦力、大白身上時,人工智慧所帶來的“第四次工業革命”已經在引領變革。
市場調研機構高德納近日公佈的最新調查報告顯示,企業人工智慧應用在近年來高速增長。全球採納人工智慧技術的企業從2015年的10%,增長至2019年的37%,增加了270%。
而研究機構埃森哲則預估,到2035年時,AI將使包括中美等12個國家在內的16個行業產出增加14萬億美元,相當於現在中國大陸的GDP總額,企業獲利能力平均能提高38%,成為拉動經濟與企業獲利的源頭。
AI技術的革命性,使其成為了全球各國科技競賽的主戰場,中國也通過推出大量的利好政策推動AI產業的發展。2016年3月,人工智慧被正式列入“十三五”重大工程,2017年3月,人工智慧首次被寫入政府工作報告,從國家的頂層設計,為人工智慧產業發展鋪路。
頂層政策的積極引導下,各地方政府也對人工智慧領域投入了大量資源,據介紹,除北上廣深等眾多一線城市,成都、西安等二線城市也均由政府與企業攜手,成立自己的AI實驗室。
單海軍所就職的之江實驗室正是由浙江省人民政府攜手浙江大學、阿里巴巴集團共同推動建立的“開放型、平臺型、樞紐型創新高地”,新一代人工智慧、智慧製造與機器人、泛資訊保安、超級智慧感知以及未來網路計算是其主要科研方向。
政策推動、政企協作,時至今日,中國在人工智慧領域的發展已經獲得世界的認可,2019年1月31日,聯合國下屬的世界智慧財產權組織(WIPO)公佈了一份研究報告,顯示在全球人工智慧領域的競爭中,中國和美國處於領先地位。
報告還顯示,人工智慧專利申請數量排名前20位的學術機構中,中國佔了17個。此外,截至2018年6月,全球能監測到人工智慧企業總數達4928家,其中美國2028家,中國(不含港澳臺地區)1011家,北京是人工智慧企業最多的城市。
有著在美國學習經歷的單海軍也表示,:“從人工智慧的角度來講,中國的發展應該說是最前沿的,業界公認美國是最強的,中國是第二強,現在很多全球頂尖的人工智慧行業的人才也都是華人,另一方面來說,中國人工智慧行業優秀的創業公司數量也很多。”
據記者不完全統計,截至2018年末,國內已經誕生了超過12家估值超過10億美元的AI獨角獸企業,總估值超過350億美元,其中包括了全球估值最高的AI獨角獸企業商湯科技。
飛速發展的人工智慧行業催生了巨量的相關人才需求,單海軍感慨,人才的缺乏是制約全球人工智慧領域發展的重要因素之一,“人工智慧領域其實火了還沒幾年,而他的實際落地應用要和各個行業結合起來很多很多領域,雖然有很多人開始從事人工智慧那麼原先培養的人才就那麼一點,但是還肯定是跟不上需求的,。此外,人工智慧技術是有很高的技術門檻的,它的背後是複雜的數學理論、技術支撐,所以優秀頂尖的人才其實很缺乏。”
行業發展與人才缺失之間的矛盾,使得人工智慧行業成為了炙手可熱的高薪行業,極高的薪資也吸引著眾多不同領域的優秀人才轉行、跳槽,“比如說智慧醫療,那麼他不僅需要從業者具有相關的醫療行業知識儲備基礎,從自己擅長的領域切入到還要是懂人工智慧,具備跨學科的能力儲備AI,這是跨行業的一些門檻。”