人機第二次世紀辯論,AI輸了
文 | 科技最前線,作者 | 北行三
戰火升級
才半年不見,Project Debater就學壞了。
2019年2月11日,AI和人類冠軍辯手在舊金山進行了史上第二次人機辯論賽,第一次的主角也是它,IBM研發的人工智慧: Project Debater。
(Project Debater)
很難想象,眼前這塊像液晶廣告牌一樣的東西就是IBM目前在AI領域最新的研發成果,而它最擅長的事,就是跟人類“抬槓”。
去年的6月的人機辯論首戰,它的兩個對手都是來自以色列的頂級辯論專家,最終戰績1勝1負。
今年在IBM的Think 2019大會上,這位AI“槓精”自然不會缺席,經過了半年的升級和準備,今年它要挑戰的人類辯手是哈利什·納塔拉簡 (Harish Natarajan)。
相比去年的陣容,今年代表人類出戰的小哥來頭似乎更大:
2012年歐洲辯論賽冠軍,牛津政治、哲學、經濟本科,劍橋哲學和國際關係碩士,英國前首相卡梅倫的學弟,現任AKE諮詢公司的經濟風險主管,得過的世界級辯論獎數不清了,還擁有多項辯論世界紀錄。
總之就是學霸+職業辯手雙重身份,且每個頭銜含金量都非常高,足夠資格代表人類。
直擊辯論現場
辯論規則很簡單,開辯前15分鐘現場公佈辯題,之前雙方都沒有預先準備,兩位辯手也沒有進行過任何交流。
15分鐘準備,開始後各有4分鐘時間立論,4分鐘時間反駁對方觀點,最後各有2分鐘結辯,基本遵循了傳統辯論比賽的規則。
而決定勝負的,是由灣區學校頂尖辯手和100多名記者組成的現場觀眾評審,在開場前評審根據辯題,投票選擇支援正方還是反方,辯論結束後再次投票,支援人數增加的一方獲勝。
隨著主持人最後一句開場語,May the best debater win,雙方辯手出場,辯題公佈:
We should subsidize preschool.
我們應該資助幼兒園。
最終持方確定:AI辯手正方,人類代表哈利什持反方。
隨後就是場下評委投票的環節,看過辯論賽的朋友都知道,這個環節對比賽最終勝負非常重要,因為勝負的關鍵是“跑票數”,也就是你能拉到多少票,而投票總人數是固定的。
所以初始票數高的一方,其實更難贏,因為你需要從更少的人里拉到票,還要保證自己的初始票都能留住。
我們再來看這道辯題,從通常角度講,加大教育經費總歸是件好事,而評委最終投票結果也符合這一情況:
79%的人同意資助,13%的人不同意資助。
也就意味著這場比賽對AI來說,好辯,但難贏。這種情況丟到任何一場辯論賽裡,都算是大逆風開局!
15分鐘準備結束,辯論開始。
今年的AI學壞了,明顯使用了非常規套路。
一上場,立論方向不從經濟角度或可行性出發,直接丟擲資助幼兒園的諸多好處:
可以幫兒童擺脫貧窮,還能幫助發展後續學業,最終還能節約醫療開支、降低兒童犯罪率。
我的轉述比較概括,而AI的原話是:補貼學前教育,可以幫助打破貧困迴圈。
不是跪舔,但這個觀點是真的複雜又高階,要讓這個“貧困迴圈”能夠前後閉合,需要大量的資料論證和極其嚴密的邏輯。
這種觀點人類一般不敢使用。
AI則發揮了整合資料的特長,除了列舉大量相關資料,還先後引用了杜克大學的研究、新澤西州的兒童犯罪案例,甚至還用上了名人名言。
其實選擇一個刁鑽的角度立論,還算正常的辯論技巧,但最讓人震驚的是在駁論環節最後,AI直接將主題昇華,說資助幼兒園還事關人類基本尊嚴...
等會兒,怎麼有點耳熟...???
這不就是個AI版本的陳銘麼,先上價值,再談尊嚴,接下來如果還有時間,就該宇宙中心呼喚愛了。而陳銘正是用這一技巧,在第5季奇葩說辯論比賽裡,幾乎碾壓了所有對手。
也就是說,在15分鐘的準備時間裡,除掉梳理觀點、蒐集資料、組織語言等常規行動... AI幾乎只用了一瞬的時間,就參透了當下對於人類最具說服力的話術:談情懷!
我們知道,人類面對機器最大的弱點是感性,它不可預測,也不受理智約束,但凡在談判或辯論中能擊中對方的情感共鳴點,這場博弈幾乎就贏了一半。
但劇情卻遠比這個複雜,可以說AI成也情懷,敗也情懷。
AI立論結束,人類辯手哈利什表達觀點。後手發言的辯手,因為可以根據對方觀點直接反駁,也可以最後做總結陳詞給評委留下更深的印象, 所以在出手順序上人類也佔了些便宜。
我們找到一段翻譯過的現場視訊:
(視訊來源:WatchThis字幕組)
在視訊中可以看到,哈利什抓住了優勢,直接反駁AI“拯救貧困”的觀點:
第一,願望是美好的,但現實很殘酷,政府資助了幼兒園實際只是資助了本來就要送孩子上幼兒園的那些人,並不能資助到最貧窮的人。
第二,資助幼兒園帶來的各種好處只是AI的推論,而且即使能實現,也不是窮人能享受到的,最終受益人還是本來就有幼兒園上的那些人。
所以“拯救貧困”並不成立,而政府資源也有限,不如把錢用在更實際的地方。
經過20分鐘2來2回,雙方結辯,最終投票結果正方AI票數從79%降低到62%,AI丟掉了17%的票數,人類獲勝。
AI為什麼會輸?
縱觀整場比賽,其實人類代表哈利什贏得並不艱難,抓住漏洞,避開查資料不如機器人的弱項,持續火力攻擊,最終獲得支援票數。
但AI作為“理智派”代表卻使用了一個更感性角度,試圖通過人性弱點來說服人類。這個角度很刁鑽沒錯,但AI忽略了很重要的一點:
人類很難與沒有情感的機器產生情感共鳴。
情懷由人說出來才叫情懷,由機器說出來,就有點諷刺了。
但本場人機辯論最有意思的地方,也同樣是這裡,AI的這種感性思維方式,明顯是人類才會使用的手段, 為什麼它可以在提前不知道辯題,不知道對手,也沒有人類干預的情況下,用了15分鐘琢磨出這種騷套路?
不妨先來看看Project Debater是怎麼辯論的。
在剛落幕不就的拉斯維加斯全球消費電子展 CES 2019 上,IBM團隊釋出的一個關於 Project Debater 的 Demo 就能給我們答案,簡單講它從拿到觀點到輸出演講稿,分為5步:
首先,判斷觀點。當使用者輸入一個觀點,Projict Debater 根據語義理解,自動判斷觀點屬於正方還是反方。
第二,篩選資料。在IBM為它構建的資料庫中,找到所有可以支援這一觀點的論據,然後判斷論據的說服力。
這個判斷標準,就來源於IBM從2014年就開始構建的資料庫,這裡面除了各種知識文獻外,還有一個非常關鍵的內容,就是觀點在社會中的反響。
這其中可能包括專家發言,民意調查,辯論賽資料等等可以反映觀點說服力的資料。
這也是為什麼 Project Debater 可以在15分鐘內想出談情懷這種套路,因為他只需要幾秒就能從資料集中發現用這種方法說服人類,總是奏效的。
找到了最有力的論點,再找到可以支援論點最合適的論據, 接下來就是去重、排列組合, 最終形成辯論整體邏輯,也就是決定先說哪個,後說哪個,怎麼去說,效果更好。
然後就到了 最後一步,把這些變成一篇演講稿, 並且要用人說話的方式,比如增加開場白,文中增加轉折、過渡語句,在需要的時候再來點俏皮話或者金句,抓住觀眾注意力。
這裡涉及到了自然語言識別,語義理解等AI領域技術,這在幾年前幾乎沒有哪個科技公司能做到,這一步對AI來說也是最艱難的一步,但 Project Debater 很顯然已經可以做到。
看到這裡其實我們就能發現,做到了這些的AI,幾乎不可能辯輸。
因為辯論最困難的部分,找論點,找論據,組織更有邏輯甚至更優雅的語言,對 Project Debater 來說都是小菜一碟。但這次比賽之所以會輸,拋開持方和先後發言這些因素, 我認為更重要的原因是表達者不是活人,而是一塊兒液晶顯示器。
是不是聽起來很荒誕,就像前面說過的,人類的選擇總是充滿感性色彩。
沒有感情,是件壞事嗎
《奇葩說》第五季中馬東說過一個數據:這檔辯論綜藝節目辦了4年,做過幾十場辯論比賽,來過數不清的內地、香港、臺灣、新加坡專業辯手,但在收視大資料統計中,收視峰值卻來自於一名非專業辯手,歐陽超。
引經據典的專業辯手那麼多,而連上場次數都屈指可數的非專業辯手之所以能獲得最高收視,正是因為他有一套獨特的辯論風格。
這位人民警察幾乎每次出場,都能極好地把控現場情緒,用最匪夷所思的語言和動作,讓全場沸騰。
換個角度看,有情緒的表達觀點是人類的優勢,對於辯論這項活動本身來說,這也是一名辯手必不可少的要素。
但對於真理的探究和思考,甚至是決策的討論來說,理性客觀才是最重要的衡量標準。
如果在這場人機辯論賽中,AI的觀點換成真人有感情地表達,或者哈利什的觀點換成機器發音,再或者讓評委通過相同的發音判斷觀點,是否比賽會有不一樣的結果?
(去年的辯論賽現場,Project Debater贏得了一場勝利)
因為聲音“太理性”輸掉了比賽,但也是這份理性給了辯論AI存在的意義,這才是IBM研發這個AI的初衷。
會辯論的AI有什麼用
作為AI領域的開山鼻祖,IBM從1962年展示了全球第首個語音識別裝置Shoebox,到1997年的深藍系統在國際象棋中戰勝人類,再到2001年的沃森系統在美國老牌智力問答節目中贏得100萬美元獎金...
直到2014年開始研發辯論AI系統,IBM費這麼大功夫搞出Project Debater,可不是為了跟人抬抬槓打打比賽這麼簡單。
這套辯論AI系統通過強大的語義理解和語言生成能力,最直接的應用領域就是淨化網路環境、輔助語言學習,以及徹底改變人機互動方式。
但更重要的意義在於,它能通過不斷提升資料處理能力,幫助醫生、投資人、律師、甚至執法機關和政府, 在做出重要決策時提供最客觀、理性、無人性偏頗、無情緒左右的建議!
這其中的價值,可遠超一場比賽的勝負。
所以,如果這才是辯論AI真正的“情懷”,那即使未來技術成熟到可以模擬更具情感的聲音,相信IBM團隊也不會實裝,否則就真成了為辯論而生,到辯論為止了。
除此之外,Project Debater 還有一個我認為的“隱藏功能”:模擬人類困境,也就是通過獨特的知識圖譜來模擬人類即將遇到的矛盾和困境。
再回頭看,是不是發現這場比賽中它提出的“資助幼兒園事關人類尊嚴”,也是模擬人類困境的結果?
至於這套演算法更深層的邏輯,或許只有IBM的研發核心成員才知道,但我們至少能明確一點: 從處理現有資料到模擬未知的事情,是AI技術進化的關鍵。
去年的辯論賽上,Project Debater 在談到“是否應該加大遠距離醫療技術的使用”這道辯題時,開場便說:
“今天有許多利害攸關的事情,對我來說尤其如此。”
緊接著它又用很惋惜的口吻說:
“我不能說自己‘熱血沸騰’,因為我沒有血液。”
這話聽起來是不是除了更像人,也更有自己的立場?
但現實還是殘酷的,我們看到的所有“機器獨立意識”,都只是程式設計師根據人類模擬出的假象,目前人工智慧技術的極限還只是“解決特定問題”。
而辯論AI的誕生,代表著IBM在嘗試教會機器該如何思考,先模仿人類角度去思考,再嘗試從自己的立場去思考。
現在看來已經完成了第一步,但在我們自己都還沒搞清楚意識是什麼,以及意識存在形式的時候,談第二步還為時過早。
不過畢竟是IBM,自信如常,他們在 Project Debater 官網底部一直留著這麼句話:
辯論,只是一個開始。
更多精彩內容,關注鈦媒體微訊號(ID:taimeiti),或者下載鈦媒體App