1. 程式人生 > >IBM的人工智慧辯論機器:如果有血液,我的血液將沸騰

IBM的人工智慧辯論機器:如果有血液,我的血液將沸騰

(上圖為2018年6月18日舊金山舉辦的Project Debater人機辯論公開賽)

“I can't say it makes my blood boil, because I have no blood. But it seems some people naturally suspect technology because it's new. (如果我有血液,它將讓我的血液沸騰。有很多人天然的懷疑新技術,因為這是新的。)”IBM的人工智慧辯論系統Project Debater(以下簡稱: Debater)在2018年6月18日在舊金山舉辦的一次公開現場人機辯論賽中,就“遠端醫療”這一辯論進行陳述時,如此陳詞。

Debater是人類歷史上首次出現的可以與人類對手進行復雜辯論的AI人工智慧系統,舊金山辯論賽的人類對手為曾在2016年獲得以色列國家辯論冠軍以色列大四女生Noa Ovadia和以色列國際辯論協會主席Dan Zafrir。Debater與兩位人類辯手在兩場辯賽中,成功在“是否應該增加使用遠端醫療”辯論中扭轉了更多現場觀眾的最初觀點。

無論是人類辯手還是Debater,都是現場拿到辯題並臨時準備。現場觀眾的評價是:整體來看,人類辯手的表達更好,但AI辯手傳遞資訊量的豐富度則優於人類。Debater歷時逾六年研發,是IBM繼1997年打敗人類國際象棋大師的“Deep Blue”(深藍)和2011年在益智遊戲節目《危險邊緣》國戰勝人類冠軍的“Watson”(中文音譯:沃森)之後的又一里程碑。

顯然,人工智慧在國際象棋中要學習的是高度程式化的遊戲規則、在益智遊戲節目中要學習的是冷冰冰的百科知識,而與人類辯論則要理解和掌握人類的政治、文化、法律、宗教、經濟甚至是情感和藝術等非理性內容,同時還要在短時間內完成廣泛而深度的閱讀理解以及長篇陳述表達,表達除要有複雜的邏輯外,還要融入適當的幽默和情緒以感染現場觀眾。種種挑戰,如果成功,亦如Debater的闡述:如果我有血液,我的血液將沸騰。

就在2018上海人工智慧大會前夕, 筆者採訪了IBM海法研究院的三位科學家,深挖了Project Debater背後的AI技術、科研價值,及其在AI發展歷程中的地位。

36篇頂級學術論文

【上圖為Project Debater首席研究員Noam Slonim博士(右)、Project Debater全球經理Ranit Aharonov博士(左)接受視訊採訪】

Debater是由IBM Research開發的AI技術整合專案,該專案由IBM研究院以色列海法實驗室於2011年提出。與傳統辯論相同,Debater與人類辯手各有4分鐘陳述自己論點,4分鐘反駁對方論點,2分鐘總結陳詞。

對於給定的主題,Debater系統會在巨大的知識庫內進行搜尋,尋找最相關的觀點和證據,然後在其中選擇最吸引人、最多樣化、支援度最高的論點,把這些構建成一個完整的觀點加以敘述。與人類辯手一樣,Debater事先並不知道辯題,在現場只有30分鐘左右的準備時間。當Debater知道了辯題後的30分鐘之內,就會通過自己的演算法在知識庫和語料庫中搜索,形成有利於自己論點的論證。

六年來,IBM研究院團隊為Debater系統賦予了三種能力,每種能力都可開創新的人工智慧領域:資料驅動的演講稿撰寫和表達——Debater第一次證實了計算機能夠消化海量語料庫,針對給定的有爭議的簡短主題描述,能夠撰寫結構良好的演講內容,並清晰且有針對性地表達出來,甚至還會適時地展現幽默感;聽力理解——能夠識別長段連續口語中隱含的重要概念和觀點;模擬人類困境——通過獨特的知識表達方式來模擬人類爭議和困境,使系統能夠根據需要提出有原則的論點。

截止到2018年9月,Debater專案一共在6大研究領域誕生了36篇國際性學術論文以及相關的資料集。

其中,在海量語料庫挖掘辯論內容領域(Argument Mining),涉及:在語料庫中偵測論點、在語料庫中自動偵測證據、自動否認論點、通過迴圈預測進行論點綜合分析、整個語料庫中無監督式論點偵測、弱監督式論點內容搜尋引擎、用自然語言計算辯論質量、辯論質量評估、用聯合推理模型進行辯論關係分類等9篇學術論文。

在深度神經網路和弱監督領域,涉及:用弱監督學習抽象概念、用弱監督學習訓練辯論內容搜尋引擎、用於提高辯論內容挖掘神經網路的高質量人工標註資料與低質量自動產生資料的混合、近似句偵測、語音輸出時的強調詞預測和強調句預測、辯論表達時的停頓預測、自動辯論內容識別、辯論打分等9篇國際學術論文。

在自然語言處理領域,涉及:用概念圖譜表達文字語義的相關性、偵測辯論結構和框架等4篇國際學術論文。在文字到語音轉換領域,涉及:改進演講稿模型等3篇國際學術論文。此外,還產生了7篇資料集相關的國際學術論文。

IBM以色列海法研究院Project Debater首席研究員Noam Slonim博士表示,儘管是六年之前開始Debater的研究,但時值今日依然認為一切工作才剛剛起步,就計算辯論本身而言就有太多有趣的問題等待被髮掘。

找到用於決策的有效資訊

(上圖為IBM 以色列海法研究院AI Tech副總裁Aya Soffer博士接受視訊採訪)

AI領域的重大挑戰是什麼?在AI領域應該關注什麼樣的人類難題,從而以關注的難題去推動AI領域的下一步發展?

IBM 以色列海法研究院AI Tech副總裁Aya Soffer博士表示,在真實的世界中並不需要回答很多瑣碎的問題,而是要回答真正重要的問題,從而做出真正重要的決策。從海量資訊中找到有助於正確決策的資訊,是非常困難的:首先,能幫助人們做出正確決策的資訊量本來就少;其次,如何找到這些資訊就更加困難。因此,從對於決策的重要性出發,IBM研究院六年前確定要把辯論作為AI的下一個重大挑戰做研究,並且使得AI擁有辯論的功能和用途。

辯論是一個開放式的挑戰,這與之前AI所解決的挑戰完全不同。之前的AI挑戰總是有具體的衡量指標用於判斷輸贏,而在辯論中則沒有明確的辦法進行打分。辯論中就像實際的商業決策一樣,沒有清晰而簡單標準,可以用分數高低衡量輸贏。Debater專案的本身目標就是建立一個系統,幫助人們在答案不是非黑即白時,作出基於證據的決定。

辯論在演算法方面的重大挑戰包括Debater要能聽長達4分鐘的內容,對方人類辯手在講的過程中可能是很快的語速,充滿激情的演說,同時還帶有道德性、倫理性陳述,Debater要在聽力理解中做到能夠理解對方所表達的主旨。這與業界所熟悉的個人智慧助手完全不同,因為像個人智慧助手類AI只需要聽懂一句話就可以,比如開燈、關燈,而Debater要在很長的語句中聽懂對方的主旨。

此外,在辯論開始時要做一個本方觀點開場白,即觀點陳述文章,要求Debater具有自動寫成功能,可以具有說服力的清晰地闡述。Debater還總結了人類專家辯手的一些共性,進行模擬、建模後注入到系統中,就形成了一個知識圖譜。一旦開始辯論,Debater就可以在已經形成的知識圖譜中進行索引和導航,找到可以支撐觀點的證據。

走近人類的智慧

“關於AI的下一步,就是智慧上越來越接近人類。我覺得Debater是一個很好的例子,它展示了我們如何教授機器,只要有充足的時間、充分的資料和演算法就可以充分前進。”Aya Soffer表示。

就Debater本身的下一步發展,Noam Slonim表示,人類的辯論能力包括三個部分,也就是幾千年前亞里士多德提出的辯論三原則:邏輯(logos)、表達(ethos)、情感(pathos)。亞里士多德曾經指出辯論術是對話中辯駁的技術,而修辭學則是演講中說服的技術,兩者在表現形式上不同,但卻有著內在的一致性。現在的AI還只能關注到邏輯本身,而對於自己的立場、向對方傳達資訊時所帶有的色彩、傳遞方式和修辭表達方式的研究還很少。

今天的Debater仍然是一個初級階段,但已經能夠向世界展示它的可行性和可達到性。那麼,Debater之後的下一個挑戰是什麼?

Aya Soffer認為,下一個挑戰就是要讓人工智慧更像人類。就好像一個小孩子去上學,看了兩三張大象的圖片後,學會了從不同的角度看大象,那麼下一次再看到大象的圖片,即使是其它的角度也能知道這是大象,也就是人可以理解概念,並且在概念的基礎上學以致用到新的領域,這種開放域的強應用能力是目前機器不具備的。

目前AI再發達,尚不能把概念進行學以致用的應用。IBM研究員們希望AI下一步的發展是從比較窄的例子上學習,而後擴充套件到比較寬泛的領域、跨不同領域的應用,以及能夠從概念上學習。這不是再學習的能力,而是具備能夠自行推理的能力。

對於Debater的商業應用,將有助於各類決策。辯論本身不是源於衝突和競爭,而是源於更有建設性的討論。辯論豐富了決策制定的過程,幫助人們權衡新想法、新理念的利弊。辯論不只是為了說服他人,也是為了理解和學習彼此的觀點,做出更加無偏見的決策。

IBM以色列海法研究院Project Debater全球經理Ranit Aharonov博士表示,Debater的可能商業應用範圍包括:金融顧問,通過Debater找出金融事實,用以支援或反對金融分析師所思考的金融投資選擇;律師,藉助Debater來尋找相關案件和主張,或藉助Debater模擬法庭辯論來分析優勢和劣勢;公共事務決策,通過Debater公正的優/缺點分析和對人類困境的模擬,為決策提供基於事實、沒有人為偏見的觀點;企業決策,通過Debater拓寬思路,在關鍵決策中納入可能沒有考慮到的新觀點等。

展望未來,雖然計算辯論是一個嶄新的科學領域,但是所支援的是人類非常古老和傳統的辯論文化。對於計算辯論的研究,無論是人工智慧本身,還是研究學者,都是“熱血沸騰”式里程碑式,將對人類的前途有著深遠的意義和影響。(文/寧川)