Google I/O 2019 中的科技向善
為期三天的2019年Google I/O 開發者大會在加州山景城的海岸線圓形劇場落下了帷幕。作為 Google 一年一度的重頭戲,今年也不負眾望地向大家呈現出了體量巨大的新內容。
延續前兩年提出的將發展重點從“mobile first”轉向”AI first”的宗旨,今年大會的科技創新主題圍繞著AI——或者更準確地說," AI for everyone" ——展開,從更加智慧的谷歌助手、升級進化的Duplex到改名更新的Nest Hub Max,谷歌展示了他們在深耕多年的AI技術上取得新一輪進展和突破。
2018年1月,騰訊聯合創始人張志東首談科技向善。在海外,Google也於2018年10月啟動了其 AI for social Good(AI向善)計劃。儘管表述上有所差異,但與“科技向善”共同代表著大型科技企業對科技創造社會福祉的信心與責任。
事實上,不僅是Google與騰訊,這兩年來,包括微軟、蘋果乃至Facebook在內的網際網路巨頭,紛紛表示要承擔起社會責任,合理運用科技為人類謀發展、為社會謀福祉。在國內,快手、美團等企業也已成為科技向善理念的先行者。
那麼,回到今年的Google I/O, 究竟有哪些點呈現了科技向善與全民福祉呢?筆者快速整合了三天大會中谷歌所釋出的豐富多彩的科技產品,梳理出了五大與科技向善密切相關的創新點。
1
Google Go:不再被語言困住的腳步
每天,數以萬計的人們使用著谷歌搜尋。但是,那些不曾接受教育的人們並未包括其中——直到今年。
今年,谷歌更新了Google Go,一款面向首次使用智慧手機使用者的搜尋應用,結合相機、掃描、AI辨識、翻譯以及語音為一體。
使用Google Go時,只要將攝像頭對準掃描想要翻譯的一塊外文廣告牌——或者售票機以及其他的東西,螢幕上就會即時覆蓋原文,顯示出翻譯內容,並且大聲為你朗誦出來。
這無疑方便了那些尚未掌握外語,卻需要在異國他鄉使用它們的人。在Google講述的案例中,一位僅可用印度語進行口頭交流,亦不識字亦無法讀寫的印度婦女。憑藉Google Go,如今已可以獨自出門購物,獨自去銀行取錢,並且自由地為自己訂一張出行的火車票。藉助科技的力量,語言再也不會困住她探索生活的腳步。
2
Duplex on the web:不再被重複拉低的效率
大家一定還記得去年 Duplex 釋出時。那段“AI騙過接線員預定位置”的精彩演示。
今年,Google 將 Duplex 拓展到了語音之外,幫助人們在網頁上解決問題。
現在,它不僅可以通過谷歌助手為你訂餐,更可以幫助使用者一鍵預訂機票和租賃車輛。具體來說,當用戶需要預訂一張下週去外地的機票時,只需要告訴谷歌助手,AI就會自動地開啟網站,輸入資訊,推進預訂流程,直到支付頁面——最後按下確認鍵,從銀行卡里扣錢的決定權依然在使用者手上。至於AI自動填充的資訊,均來自於使用者的旅行歷史記錄,以及在網站上儲存的付款資訊。使用者也可以在後臺修改 Duplex 可訪問的資訊許可權以及徹底刪除自己的隱私資訊。
Google 表示,Duplex on the web目前主要專注於預訂票務以及租賃車輛這兩個具體問題。不過可以想見,其在未來的廣泛應用,對於人們的日常工作生活效率會有值得期待的提升,人們將不再被重複工作所束縛。
3
暢遊數字世界不被生理障礙束縛
Live Caption(即時字幕)並不是一個新鮮事物,實際上就指的是我們在看電影、看劇時的“字幕”,字幕除了幫助我們觀看外文的影視作品之外,還可以幫助聽障人士獲得此時此刻的聲音資訊。
因此,Google 通過技術手段拓展了字幕存在的邊界,讓它從只服務於靜態的影視作品,變成可以為所有聲音打上字幕。
據 Google 介紹,即將釋出的 Android Q 版本中將包含一個服務,能夠在手機視訊通話、語音通話以及任何 Android 手機發出聲音的過程中為使用者提供即時字幕功能。它的服務物件是那些因為聽力障礙無法進行常規交流的人群,讓他們能夠更順暢的使用智慧手機帶來的便利。
Live Relay與Live Caption類似,針對的是具有言語障礙和聽力障礙的人群,幫助他們解決實時溝通問題。譬如,在打電話的過程中,AI會首先迅速識別對方的語音並轉化成字幕,然後,使用者將回復打出來,AI再將文字轉化成語音,回覆給對方。
而最特別的,是Euphonia。它是一個仍處在科研過程中的專案,旨在將AI語音識別模型運用到漸凍症(ALS)患者的日常交流之中,解決ALS患者的溝通困難問題,讓他們同樣可以表達自己的感受。其運作過程是,抓取ALS患者有限的面部表情和語言表達,將它們轉成聲譜圖的視覺形式,輸入AI學習系統,構建出ALS人群的特殊模型,併為他們所用。
谷歌現場播放了這項技術的測試視訊:當ALS患者觀看球賽,因為進球而做出欣喜反應時,AI便會識別出來,播放歡呼喝彩聲來表達使用者的情緒。
正如視訊中一位語言障礙的測試者所說,能夠被人理解的感覺真的太棒了。
這無疑是此次 Google I/O 也是科技的高光時刻。
4
更完善的隱私控制機制
網際網路公司對於使用者個人資訊的收集和運用一直以來都是被外界廣泛質詢的議題,谷歌也不例外。今年,Google 在大會上一口氣宣佈了多項關於使用者隱私的系統升級和功能優化。
譬如,Google Account 為隱私設定提供多項合一的檢視,使用者通過一次點選即可訪問;谷歌地圖新增加了隱身模式,確保使用者的行蹤隱私安全。Android Q 系統也進行了幾項安全升級。
此外,在 Google 的視訊智慧音箱 Nest Hub Max 中,裝置所帶有的攝像頭也裝配了工作指示燈,在攝像頭開啟時會一直處於亮起狀態,用於保護使用者的隱私。
5
解決演算法偏見,惠及每一個人的AI
TCAV是谷歌正在使用的一種新研究方法,旨在“解決機器學習中存在的偏見性問題,以及讓模型更加具備可解釋性”。它可以檢測出某一學習模型中可能存在的錯誤,通過檢視該模型的研究資料中某一具有偏向性的指標樣本量是否過大。
譬如,某一檢測醫生影象的模型中,男性醫生的影象過多,會導致模型錯誤地認為“男性”是醫生的一個重要特徵,而TCAV能夠發現這一點,使其得到糾正。當前,谷歌已將這項技術開源。
Google AI Impact Challenge 是谷歌發起的專案,旨在尋找那些致力於用AI技術使世界更美好的提案,並提供資金和技術支援。目前,已經有20個專案在谷歌的支援下進行,它們聚焦了健康、環境和教育等領域的重要議題。
在本次大會上,被提及最多的片語是“For Everyone”。正如文章開頭所提到的,2018年1月第一屆科技向善年度論壇上,騰訊聯合創始人張志東首談科技向善理念時,其中一個體現便是不僅以“目標使用者”作為科技應用的落點,而要以廣闊的人類福祉視角引導科技創新。
如何用科技惠及人類、惠及社會,或許會是騰訊、Google 等科技公司接下來很長一段時間裡專注探索的方向。隨著研究和探索的不斷深入,更廣泛的討論和更廣大的版圖正徐徐展開。
--END--
作者 |
黃瓛鈺 騰訊研究院助理研究員
王健飛 騰訊研究院研究員