這個AI正在解碼我們的大腦，它比人類更適合當“科學家”

編者按：本文轉載自微信公眾號 “量子位”（ID：QbitAI），編譯整理：李杉李林；36氪經授權發布。

- 壹 -

羅米（Romy Lorenz）是個金發藍眼的姑娘。

2013年，她考入倫敦帝國理工學院，師從神經科學家裏奇（Rob Leech）。兩年後，羅米的博士項目幾乎過半，但實驗卻未能取得任何成功。她得想辦法讓研究回到正軌。

“我們想創造一個實時的神經反饋。”羅米回憶道，“讓病人躺在大腦掃描儀裏面，根據我們在掃描儀上看到的信息，告訴他們如何改變其大腦不同部位的活動。”

為了實現這個目標，裏奇和羅米重新編寫《我的世界》（Minecraft）的代碼，用來反映玩家的大腦活動。“這是我女兒當時最喜歡的遊戲”，裏奇說。

2014年10月，羅米讓誌願者進入磁共振掃描儀裏，然後在像素化風格的遊戲世界裏四處閑逛。《我的世界》的畫面顯示在誌願者面前的屏幕上，他們通過兩個圓形手柄來控制遊戲角色。

這個神經反饋實驗使用了一個基本程序，能解碼大腦掃描信息，並根據玩家的狀態，對遊戲中的燈光進行明暗調節。如果玩家沒有集中註意力，軟件就應該調低亮度，迫使他們集中精力。相反地，當玩家集中精力時，軟件又會調高亮度。

羅米的實驗希望能夠對大腦默認模式網絡中的一系列活動進行活躍度控制，這裏把大腦皮層的部分部位與更加深層的區域（例如海馬體）連接起來。當我們不集中精力時，它會變得最為活躍。

但這個實驗卻失敗了。

“我本來也沒有奢望自己的第一個實驗能夠成功。”羅米說，“但我的博士項目已經過半，最初的課題似乎看不到希望。我發現自己必須搞點創新。”

2015年1月，當羅米和裏奇會見她的第二位導師、神經學家阿杜（Aldo Faisal）時，他們開始探討最佳方案。

“阿杜並非來自功能性磁共振成像（fMRI）領域。”羅米回憶道，“所以在向他解釋這些實驗如何在fMRI掃描儀內進行，以及都有哪些技術可以控制實時fMRI時，我們突然有了靈感。”

- 貳 -

如果徹底改變這項實驗，會發生什麽情況？

如果不再試圖用光照這一個參數來創造反饋回路，而是自動探索許多不同的參數組合來驅動大腦，達到他們想要的任何狀態，又會發生什麽情況？

然而，這種實驗過於復雜，人類很難實時控制。所以，他們不可避免地需要使用人工智能來運行試驗。雖然AI已經在許多方面得到應用，但現在的問題是：如何利用人工智能來解決神經科學問題？

“我們希望借助《我的世界》這項實驗解決很多不同的新問題。”羅米說，“我們嘗試了高度復雜的遊戲環境，還努力解碼大腦中的不同網絡如何展開實時互動。簡單來說，我們這一步邁得有點大。”

她為接下來的實驗積累了一條非常明確的經驗：從簡單入手。

羅米現在需要的是通過一個已經被充分理解的問題來測試自己的想法。她決定從研究最為透徹的大腦區域開始：視覺和聽覺皮質。

想要找到只激活聽覺皮質而不激活視覺皮質的要素，非常容易，反之亦然——前者可以用空白屏幕配合著口技演員的表演來實現，後者則可以用東京火車站喧鬧的視頻配合著測試音的嗡嗡聲來實現。

但人工智能機器卻需要自學這種方式。“實驗聽起來很無聊，”羅米說，“但如果能夠成功，就具有深遠的意義。”

人工智能算法必須利用這兩種手段來開啟和關閉大腦的兩個部分：通過調整熙熙攘攘的街景視頻播放速度來改變視覺刺激的復雜性；通過語音編碼器讓一個人的聲音更像機器人來改變聽覺刺激。

羅米和裏奇嘗試了深度學習等不同的人工智能算法，但卻沒有一個能夠發揮作用。

- 叁 -

2015年3月，在倫敦大學國王學院統計學家喬瓦尼（Giovanni Montana）和他的博士生裏卡多（Ricardo Pio Monti）的幫助下，羅米和裏奇以貝葉斯優化為基礎開發了一套人工智能算法——這是一種以18世紀的長老會牧師托馬斯·貝葉斯（Thomas Bayes）的名字命名的方法。

貝葉斯設計了一種系統化的方法：基於對世界運行方式的假設，便可計算出新的元素加入進來後，發生某種變化的概率。

這種方法可以根據之前的知識計算某種假設的合理性。貝葉斯的方法非常適合開發人工智能，它可以主動尋找最佳的答案或實驗。

5月，羅米再次讓數十名誌願者進入她的fMRI掃描儀。“fMRI的好處是，誌願者躺在掃描儀裏，你可以立刻看到實驗是否有效。”羅米解釋道，“裏奇和我屏息靜坐。我們都很緊張。”

當第一位誌願者躺進掃描儀時，那臺機器先是進行了一些漫無目的的嘗試，但突然之間就找到了合適的視頻和聲音組合。

“我們以為這或許只是運氣。”羅米說，“但每一個新的誌願者進來，系統都可以發揮作用。”平均而言，這套人工智能算法都能在6分鐘後找到最優的刺激方案。

裏奇狂喜不止。

“我們意識到這項技術有多麽強大。”他說。他們創造了第一個人工智能科學家。他們決定將其命名為“自動神經科學家”（自動神經科學家）。

- 肆 -

盡管科學追求客觀，但卻不可能完全不受人類偏見的影響。我們或許擁有超凡的模式識別能力，但也經常看到虛假的相關性。

2005年，斯坦福大學教授John Ioannidis發表了一篇驚世駭俗的文章：《為什麽多數研究結論都是錯誤的》（Why Most Published Research Findings Are False），並因此震驚同行。

這篇文章認為，多數科學研究論文的結果都不能獨立復現。10年後有報道稱，超過半數的心理學研究無法復現。而Ioannidis今年發表的一項研究顯示，認知神經科學的情況甚至更糟。

當然，大腦內部盤根錯節的運作方式並不容易理解。神經科學家過去幾十年一直通過掃描大腦來尋找人類的特定活動會激活哪些回路。但始終沒有確切答案。

例如，疼痛回路與突出回路極其相似，前者是在我們感受到疼痛時被激活的大腦部位，後者則是在某個物體或個人在特定背景中十分顯眼時激活的大腦區域。另外一個名為顳上溝的區域則負責處理各種不同的任務，包括運動、語言和面部識別。

當然，前提是你相信這些研究。很多發現使用的樣本量都很小，統計方式不夠完善，分析也存在瑕疵。有的研究還無法復現，即便是采用相同的方法也不例外。即便能夠復現，很多相關性也會在樣本更多的研究中消失。

2009年就出現過這樣一個案例，當時對一條死三文魚的掃描顯示，它的腦活動足以表明它仍在思考。這種現象被命名為“死三文魚效應”。

科學家終歸也是人。“歸根到底，我們都是人，無法做到足夠的客觀。”羅米強調說。畢竟，我們的大腦優化的目標是生存，而不是實驗。

當羅米第一次建議用人工智能研究人腦時，裏奇立刻其中蘊含的深刻意義震驚了。與人類科學家不同，人工智能的偏見相對較低——它可以復制研究結論。

“我從沒想過這麽做。”裏奇回憶道，“但如果羅米完全按照我說的去做，我們不可能有如今的成就。”

裏奇曾經在劍橋大學就讀心理學本科，他很欽佩Paul Feyerabend，這位奧地利心理學家認為，如果科學是為了取得進步，“怎麽都行”。而使用人工智能來理解人類智能就是“怎麽都行”的典型代表。

“我們可以徹底改變常規的科研方式。”裏奇說。

在“自動神經科學家”取得成功後，裏奇認真考慮了神經科學的各種可能後，給出了樂觀的結論：“讓貝葉斯優化一切！”

- 伍 -

在他們第一次取得實驗成功後，羅米和裏奇很快意識到，機器人的潛力不僅局限於剖析人腦運作模式，還可以有其他用途。例如，可以用於設計臨床測試，或者了解如何通過刺激大腦來改變行為。

他們知道，“自動神經科學家”成功了。現在，他們需要對其提出挑戰，挖掘它的潛力。“經過了第一項研究後，我們希望做一些震驚這一領域的事情，同時回答新的問題。”羅米說。

這項挑戰來自羅米、裏奇和他們的同事亞當（Adam Hampshire）在2015年秋天進行的一次對話。

亞當當時讀完了神經科學家歐文（Adrian Owen）和IQ專家John Ducan的博士學位，歐文曾在上世紀90年代末使用大腦掃描儀幫助植物人患者交流，並因此引發強烈反響。

在讀博期間，亞當和歐文開發了在線認知測試來監測腦損傷後的恢復情況，並且評估智力藥物的效果。我當時是《每日電訊報》的科學編輯，我建議他們對讀者進行一次在線測試，了解年齡、性別、生活方式等因素對智力的影響。

歐文和亞當選擇了12項認知測試，還評估了從記憶到推理的各項能力。歐文將這些稱作智能的支柱。那項用於評估演繹推理能力的測試名為Odd One Out，也就是挑出特殊的那一個：在測試中，被試需要找出一個邏輯上與其它選項不同的形狀。

這些智能支柱是為了測試能否通過一個或幾個參數來衡量人類的智力。“這種想法可以追溯到1904年，心理學家Charles Spearman當時提出，存在一種通用的心理官能來支撐所有的認知能力，現在稱之為‘Spearsman假說’或‘g’。”亞當說。

如果我們可以完全通過“g”來評估人類智能，那麽Odd One Out這樣的測試就只是衡量同一個參數的不同方式：如果你在其中一個測試中表現優異，在其他測試中同樣會表現不錯。

等到這項測試2010年上線時，歐文和亞當都去了加拿大的西安大略大學。“由於突然湧入數以千計的訪客，網站崩潰了。”亞當回憶道。

四個多月來，全球有11萬人參加了這個測試。他們通過篩選一百萬多個數據點，得出了一個確切的結論：智能不可以歸結為單個因素。“在測量大量認知任務的時候，個體表現上的差異可以至少由三種獨立的因素來解釋：短期記憶、推理、語言能力。”亞當說。

亞當和歐文覺得，這三種因素有可能分別對應著大腦中三個完全不同的回路，於是，他們繼續研究，找了16名被試，在fMRI掃描儀上進行智能支柱測驗。

- 陸 -

他們的猜想是對的。

“彼此在表現上相關性較弱的任務，在大腦中激活的也是不同的網絡。”亞當說。比如演繹推理，似乎與大腦額葉和頂葉裏的外側部相關，而空間工作記憶激活的區域，則深埋在額葉最後一個溝回中。

“基於這些實驗，我們提出大腦中的每個網絡支撐著一種能力，”亞當說，“從結果來看，這個結論似乎顯而易見。”

2012年，亞當和歐文把這一成果發表在神經科學期刊《Neuron》上，在論文開頭，他們說：“心理學中，少有像人類智能研究這樣古老又充滿爭議的主題。”這是一個低調的聲明。

這項研究引發了一股反對的浪潮。盡管有些認知神經科學家認同他們的工作，但很多心理測量研究者怒火沖天。

心理學期刊《Intelligence》上發表的一篇反對意見說，他們的結果“基於一系列假設和主觀決定，往好了說，也就是允許不同解釋而已。”一位研究者發Twitter說它是“過去10年來最差論文之一”。

批評者說，他們的大規模實驗在設計上有漏洞，上萬人參加了測試，但這些人真的具有代表性嗎？他們為什麽不去尋找大腦中已知和“g”相關的效應？他們為什麽用循環邏輯，選擇那些好像最容易觸發大腦不同區域的任務？

抵制風潮過去幾個月後，亞當渴望回到英國。他覺得歐文成了一個拿自己的資金和聲望到處自吹自擂的神經科學家，做他的下屬很憋屈。

2013年6月，也就是羅米開始讀博的時候，亞當和裏奇在同一幢樓裏開設了自己的實驗室。然而，他倆直到2015年秋天，才第一次見面。

亞當依然癡迷人腦如何支持智能的不同方面。對2012年那篇《Neuron》論文的批評意見，他是不同意的，但他還是想優化之前的研究，做個改進版。

“受限於所用認知任務的數量和種類，那項研究的範圍太局限了。”亞當說。

當亞當聽到羅米和裏奇描述他們的自動神經科學家時，他意識到，這個東西足以改變遊戲規則。

裏奇說，他們用AI來進行實驗，一次測試一位被試。而亞當聽錯了，以為裏奇要做涉及上千名被試的多參數平行實驗。“他把這變成了一種高度概念化的東西，用堅實的統計基礎為很多人同時優化。”羅米說。

亞當認為，“這個瘋狂的想法有它的優雅之處”，人類認知“是一個難到非人力所能及的問題，所以，我們讓機器來解決它。”

- 柒 -

2016年6月，羅米在亞當2012年的腦成像研究基礎上，試用了自動神經科學家。

她讓21名誌願者進行了16項認知測試，然後讓機器找出每一項測試激活了大腦中哪些回路。她用到的測試，有一些是《Neuron》2012年那篇論文用過的。

AI只花了幾分鐘時間，就根據任務對亞當提出的兩個大腦網絡的激活情況，選出了一些任務。這兩個大腦網絡，就是我們前文提到的演繹推理和空間工作記憶。

看到這樣的結果，亞當又“安心”，又驚訝。

根據現有的研究，他們選擇的很多任務應該激活其他回路，結果卻證實了2012年論文提出的三個回路中的兩個，真是“純粹，盲目的幸運”。

5月的一個上午，這個團隊重復了原來的實驗，他們的葡萄牙同事伊內斯（Ines Violante）勇敢地躺在掃描器巨大磁鐵中間的洞裏。幾分鐘後，羅米拿了一份圖表給我看，上面展示了伊內斯做每個測試時，不同大腦網絡的激活情況。

那份圖表，看起來就像一幅馬克·羅斯科的畫，顏色鮮艷。紅色，表示兩個回路中的活動沒有順利銜接，藍色，表示他們連接得很好。

在圖表的右下角，有一個紅色的菱形，表示兩個測試利用了兩個相互獨立的回路：演繹推理和空間工作記憶。裏奇笑著說，這很好地復現了之前試用的情況。

亞當、裏奇和羅米現在正準備重新做2012年的在線智能測試。“我們想開發一個AI機器，讓它具備通過叠代方式學習的能力，從大量的數據中，公正地找出人類智能的主要部件。”亞當說。

測試的數量從2012年的12個，擴充到了60個。他們把這些測試放到網上，人人都能參與。他們預計，完成60項測試任務的會有幾千人。

機器學習算法每次會獲取100人的信息，然後去修改、挑選這些任務，構成一個集合，其中某一個任務上的表現和其他任務毫無關聯。

自動神經科學家會修改測試，從某種意義上講，設計它自己的實驗。

- 捌 -

為了向我解釋AI在理解大腦這件事上的意義，裏奇將它比作猜字遊戲：一個人選出單詞，另一個要一個字母一個字母地猜出來，這個詞究竟是什麽。

傳統的大腦掃描類似於一次猜整個單詞，研究人員事先確定要用掃描儀測量什麽，在認知任務中記錄這些數據，用各種統計工具來“折磨”這些結果，直到它們承認自己和研究人員預設的理論有某種關聯。

AI方法和那個遊戲的玩法更接近：拿一個字母來試試，看它合不合適，然後調整假設。

這項研究有著更廣泛的影響。裏奇相信人工智能可以消除研究中的主觀性，從不完美假設出發進行探索，變成了從完善的、不斷優化的假設出發，進行探索。

當然，你還是需要有人提出最早的假設，寫代碼、做設想、定義試驗中的自由、寫出論文等等。

但機器比人快，比人可靠。

裏奇說：“復制，就存在於這種方法的DNA中，它有著廣闊的潛力，可以變革整個領域。自動神經科學家可以變成自動的放射科醫師、自動心理學家等等。”

羅米

2017年6月13日，羅米獲得了她的博士學位，在期刊上發表了12篇論文。

羅米還記得，她在柏林技術大學做研究員，研究腦機交互接口、幫助截癱患者的時候，在一次學術會議上，忽然意識到她所在的領域沒取得什麽進展。

她說：“所有這些實驗室都獲得了不少資金，用來幫助患者去生活，但他們所專註的只是對算法進行很小的改進，我覺得很沮喪。我只有看到能帶來真正進步的東西，才能充滿激情。”

四年後，她終於找到了可以為止奮鬥的領域。

- OMT -

上文提到了一組放在網上，人人都能參與的認知測試，它叫Cognitron，是第一個由人工智能設計的人類心理技能測試，地址是：

http://www.cognitron.co.uk/

登錄這個網站，提供一些個人信息，AI就會為你設計30分鐘到1小時的測試題，還會告訴你成績如何。

參與測試的人越多，AI就能越深入地理解人類智能。Cognitron將通過叠代的方式從測試結果中學習，找出人類智能的構成要素。

亞當說，如果有超過2萬人參加測試，“AI就能通過學習，繪制出比此前任何研究都詳細的人類智能結構圖譜。”

Tags: 裏奇大腦實驗這個玩家我們

文章來源：