搜狗CEO王小川:AI如何幫助我們用語言連線世界
10 月 27 日,由《麻省理工科技評論》、DeepTech 深科技聯合主辦,梅賽德斯-賓士特別呈現的“全球科技青年論壇” 在北京舉行。論壇集結了海內外 30 餘名頂尖科學家、企業家與研究者,為現場超過 600 名關注新興科技、熱愛科學事業的參會者開啟了接觸前沿領域專家的機會。
搜狗 CEO 王小川在會上發表了演講,探討了資訊文明時代下的人與資訊的關係,同時分享了搜狗在這方面的 AI 技術創新和應用。

圖丨王小川(來源:DT君)
DT 君就王小川在論壇中的精彩演講進行整理,內容略有刪改:
今天我講的主題是資訊文明到智慧文明的一些思考,尤其是搜狗在其中會扮演什麼樣的角色。
一次又一次技術的重大突破帶來了文明的躍遷,從農業文明到工業文明。隨著計算機、光纖、網際網路的發明,我們進入到了資訊時代的資訊文明。
80 年代末到 90 年代,我們非常重視電腦打字和輸入法,因為只有中文能夠被這個輸入法資訊化,我們才有機會進入到資訊文明。搜狗協助了這樣的中國資訊化,實現了大家表達的突破。
人和資訊之間的關係有很多的維度,其中一個是讓人能夠輸出資訊,這就是輸入法。另一個維度是在網際網路上獲得資訊,這方面最重要的產品就是搜尋。所以搜狗在自己定義使命的時候,其實緊貼著資訊文明的時代,讓表達和搜尋資訊更簡單。

圖丨王小川(來源:DT君)
這裡有一個核心就是語言。其實在人類歷史上,掌握一種語言就掌握了一種靈魂,全球有 7000 多種語言,只要你對語言有深刻的理解,你就理解了一種文化。而語言對計算機來說是非常有挑戰的,在自然語言處理的資訊科學裡,有一句話叫“自然語言處理是人工智慧皇冠上的明珠”,但它很難。當我們做輸入法、搜尋的時候,也需要大量地跟語言的處理打交道。
從機器文明向智慧文明發展的時候,人工智慧技術的突破,例如最新的翻譯模型的演化,開始把翻譯問題變得可解決。我們讓表達和資訊獲取變得更簡單,不僅可以做到中文,還可以做到跨語言的表達。我們也可以使用跨語言的引擎,輸入中文,輸出的是外文,或者輸入中文查詢全球資訊,這就使得我們可以做跨語言的輸入和搜尋。
而在資訊文明到智慧文明之間,我們在 AI 上的突破能夠起到銜接的作用,未來走向智慧文明之後,人是需要通過語言進行表達而連線這個世界的。
這裡有兩個詞:自然互動、知識計算。這意味著我們希望以人的方式與機器交流。我們從人去適應機器,開始變成機器適應人。以前機器計算力不足,所以人需要去記憶編碼,用了語言後這個過程就變得更加自然了。如今的手機也從以前的鍵盤滑鼠走向了觸屏,也變得越來越自然。因此在這個和語言相關的大方向裡,人其實不是靠敲鍵去做的,而是靠聽覺、視覺進行交流和溝通。
我們容易想到的方向就是語音識別,現在語音識別已經變得非常可用,但語音識別之外還有什麼東西呢?除了讓機器聽懂人的表達之外,還要能以人能聽懂的方式進行表達,裡面涉及到聲音、影象的合成,讓人用聽覺和視覺來獲得資訊。
而除了自然互動以外,還有一種領域叫知識計算,它不僅是在語言層面上通過語音影象進行表達,而是要在語言中間進行更抽象的計算。其實語言不像語音影象,它代表了我們對概念的掌握和推理。搜狗做這樣的研究,特別大的優勢是有場景來使用它們。

圖丨王小川(來源:DT君)
談到輸入法的未來,我們很容易想到語音輸入,但這個是不夠的。去年搜狗上市的時候,當天就收到了 3000 條祝福資訊,這讓人很難一一回復,因此也許真正智慧的輸入法不僅是用語音來輸入,而應該讓機器產生一定的理解能力,做輔助性的輸入,這樣的技術我們已經開始運用在一些較為垂直領域了。
谷歌曾在 I/O 開發者大會上展示過輔助人進行表達和對話的語音助手。這種輔助人進行表達和對話,意味著輸入法不再只是一個打字工具,它會變成你的助理,不只是讓你做一道填空題,而是把填空題變成選擇題,來理解你的個性,最後你做選擇。這樣能極大地提升效率,特別是在客服、銷售的這些領域裡,能夠把企業文化和他們的術語用到個人表達裡提高工作效率。

圖丨王小川(來源:DT君)
另外,搜尋到智慧時代之後會有什麼變化呢?我們現在說到的語音搜尋其實還只是解決一個互動自然的問題,而事實上,目前搜尋的重大發展方向是從搜尋走向問答,我們以前習慣於搜尋一個關鍵詞,得到 10 條結果,但這是不自然的過程,這是人被迫適應機器不智慧時候的一種方式。
今天更多的研究是在於,如何在你說一句話的時候,機器就能理解你的提問,同時這個機器在閱讀網上數千個頁面的時候,在頁面中間產生閱讀能力來尋找答案,從而把搜尋從一個關鍵詞引擎走向一個問答引擎。
在這個裡面,我們已經做出一些實用的產品來。目前搜狗搜尋已經能做到大概 20% 使用者的提問搜尋直接給出答案,而不是給 10 條的結果了,這也是今天搜尋行業正在努力的方向。
在國際上,關於問答領域的研究也成為了人工智慧中語言方向的重要研究之一。從一個資訊文明向智慧文明過渡的時候,我們讓機器開始幫助人更好地進行溝通,我們稱為自然互動,幫助建立智慧,並開始做知識的計算。
所以在這種情況下,最終我們可以看到這樣一個 AI 能力:以語言為核心,開始具有與人溝通、能聽懂、會表達的能力,以及開始處理人的資訊和網際網路的資訊,能開始理解你的概念,做推理,成為個人助理,這在行業當中叫 VPA(虛擬個人助理)。
這就是 AI 時代裡面,從資訊文明到智慧文明過渡的重點方向,這也是搜狗努力的方向,我們有很好的技術能力和使用場景來支援這種業務的發展。